NASA is landing on Mars!

Mastcam-Z, a zoomable pair of cameras aboard NASA’s Perseverance Mars rover, is getting magnificent images from Mars, after its successful landing in 18/Feb/2021.

NASA has posted a 360 degree panorama photo on their website:
https://www.nasa.gov/image-feature/jpl/mastcam-z-s-first-360-degree-panorama

Mars (火星 huǒ xīng)

Landing (登陆 dēng lù)

Read More

  • 文章的「字」自动分组成「词」表格,贴入Excel, WordWall, 或Quizlet

    文章的「字」自动分组成「词」表格,贴入Excel, WordWall, 或Quizlet

    中文的「词」是由多个「字」组合而成,许多情境都会需要将一整段文章「分词」来制作教材。 使用 拼音注音编辑器 toneoz.com/ime 自动分词 ToneOZ的分词功能是使用内建的 17万词辞典,词库涵盖两岸教学字典、检定考HSK(汉语水平考试)、及TOCFL(华语文能力测验),适合教材制作,全自动处理省时又简单。 以下范例示范如快速将整篇中文文章分词,汇出到Microsfot或Google试算表、Quizlet或WordWall互动教材工具。范例汇出时用到的软体均为举例,实际使用时老师们可自行灵活更换: 整篇文章自动分词,做成中文 、拼音 、注音三栏Excel表格自动筛选,找出检定考4级以上的生难词,汇出到WordWall汇出到Quizlet …
  • 生字词加拼音注音,其他字不标音,如何快速完成?

    生字词加拼音注音,其他字不标音,如何快速完成?

    使用 拼音注音编辑器 toneoz.com/ime 简单快速可自订中文生字词的筛选及标音。也可用内建的中文检定考HSK(汉语水平考试)及TOCFL(华语文能力测验)分级生词表, 将同级词语的标音一起显示或隐藏。 本文提供三种情境的作法范例,每个范例都可以在10秒内快速完成整篇文章生词筛选: 学过的初级字隐藏标音:123级「字」不标音,其他标音 没学过的生字词才标音:其他不标音,456级「词」标音 自己指定要标音的字词:其他不标音,指定「字」才标音 首先请在 …
  • 澳声通注音拼音TrueType字型。标准楷书、可自动选多音字。

    澳声通注音拼音TrueType字型。标准楷书、可自动选多音字。

    提供繁简笔顺两版本字型,拼音注音互通,免费商用授权,满足中文现场教学需求, 搭配「免费免安装」的多音字自动选音工具: 多音字选音编辑器https://toneoz.com/ime 使用范例 教学影片 简体字版使用教学 https://toneoz.com/blog/2021/10/07/kai-font/ 拼音鼎楷-简 拼音库楷-繁 大拼音鼎楷-简 …
  • 澳声通拼音楷体。标准楷书、可自动选多音字的TrueType拼音字型

    澳声通拼音楷体。标准楷书、可自动选多音字的TrueType拼音字型

    提供四套可免费商用的繁简楷体字型,满足中文现场教学需求 , 搭配「免费免安装」在线选音工具: 多音字选音编辑器https://toneoz.com/ime  繁体字版使用教学 https://toneoz.com/blog/2021/10/14/zhuyinkai/ 拼音鼎楷-简 拼音库楷-繁 以上两种拼音大小适当不影响字距,适合文章阅读或试卷。 另外两种拼音加大的版本,适合投影片或标题。每个字的拼音宽度不同,最短的只有一个字母,最长的字「装zhuāng」有6个字母,大拼音字型的拼音此时可能会重叠,使用者可利用字距或者加入空白来调整。 …
  • 3623个日本汉字与繁体字形笔画差异:用思源黑体分析繁体常用4808字

    3623个日本汉字与繁体字形笔画差异:用思源黑体分析繁体常用4808字

    本文接续前文「思源黑体分析繁体简体字形笔画」: https://toneoz.com/blog/2021/09/21/2275strokediff/ 以下资料同样为思源黑体分析繁体常用4808字,但改为比较日本版与繁体版, 结果发现有3623字有差异, 其中包含笔画不同或者是日文缺字的部分: 编号(1~4808) /汉字/ 繁体中文 / 日文汉字 …

The 3% diff pronunciations in Chinese Mandarin between Mainland and Taiwan

Given 100 questions, a Pinyin student answered all correctly, but a Zhuyin teacher might only give him a score 97% . Why ?

Mainland Common Tongue (Pǔtōnghuà 普通话) and Taiwan National Language (Guóyǔ 国语)

By “character” : 13~38% Diff

There were many essays related to the topic “Pronunciation differences in Chinese Mandarin between Mainland and Taiwan”. e.g. :

“Comparison of the Chinese pronunciations between Mainland China and Taiwan” (海峡两岸字音比较) by Qingmei Li (李青梅), 1992

 “A Study of the Distinction of Pronunciation Standards between Taiwan and Mainland China” (两岸语音规范标准之差异探悉) by Jihong Nan (南基弘), 2008

Most of them are based on “Diff by character” : The 3500 high frequency words specified in “List of Commonly Used Characters in Modern Chinese” (现代汉语通用字表, 1988).

Experts check the differences character by character. While a mismatched pronunciation was found, essays usually provide several example “words / vocabularies” with that character.

E.g.: 绩/绩 (means “achievement”) is pronounced differently. In Mainland it is tone 4  (jì ㄐㄧ\), while in Taiwan it is tone 1 (jī ㄐㄧ). As an example, the vocabulary “成绩/成绩” :

In this way, a final diff percentage was calculated, based on characters:

“13%~38%” is a large difference. It makes people feel like a student could only get a reduced score of 62%, with his 100% corret study from the other side? A little bit more than realistic.

By “vocabularies” : 3% Diff

In stead of only compare the 3500 characters, ToneOZ tried a new way : To compare all 170,000+ words / vocabularies in the dictionary. The Chinese characters are pronounced differently after they are combined into words / vocabularies, this should give us some data from a different point of view.

By “vocabularies”, there are 513 characters from around 6K words/vocabularies have been identified with different pronunciation between the Common Tongue and the National Language. It is based on a programmatically comparison and then a manual review for around 170K words/vocabularies from several word banks :

CEDICT (the largest open source Mandarin-English Dictionary)

National Language Mandarin official dictionaries “Applied Modern version Jian-Bian-Ben” (国语辞典简编本) and “Literature version Zhong-Bian-Ben” (国语辞典重编本) by the Taiwan Ministry of Education)

“Jeiba” Chinese text segmentation database.

The diff rate is 3.88% : In all 170,580 words, there are 6,623 words are pronounced differently.

We also use word banks to filter percentages from “high frequency words” only. In Australia, there are 2 common Chinese certifications:

Chinese Proficiency Test, Hanyu Shuiping Kaoshi
(汉语水平考试 , HSK)

Test of Chinese as a Foreign Language
(华语文能力测验, TOCFL)

They are both designed for non native Chinese speakers to learn general conversations. As results:

The results filtered by HSK and TOCFL are all close to 3%, which gives us more confidence in this number. And if we filter from basic levels only, the percentage becomes around 1%(For basic conversation ability, HSK level 3 or TOCFL level 4 is required).

In conclusion : There are pronunciation differences in Chinese Mandarin between Mainland and Taiwan, but not too much, only about 3% words are pronounced differently. In general conversation the difference rate could become 1% only. You don’t have to worry too much about these differences if you are learning Chinese.

Toneoz.com/data provides a list for all the Chinese words with pronunciation differences, and it can also check pronunciation differences from a whole Chinese sentence.

Read More

  • 文章的「字」自动分组成「词」表格,贴入Excel, WordWall, 或Quizlet

    文章的「字」自动分组成「词」表格,贴入Excel, WordWall, 或Quizlet

    中文的「词」是由多个「字」组合而成,许多情境都会需要将一整段文章「分词」来制作教材。 使用 拼音注音编辑器 toneoz.com/ime 自动分词 ToneOZ的分词功能是使用内建的 17万词辞典,词库涵盖两岸教学字典、检定考HSK(汉语水平考试)、及TOCFL(华语文能力测验),适合教材制作,全自动处理省时又简单。 以下范例示范如快速将整篇中文文章分词,汇出到Microsfot或Google试算表、Quizlet或WordWall互动教材工具。范例汇出时用到的软体均为举例,实际使用时老师们可自行灵活更换: 整篇文章自动分词,做成中文 、拼音 、注音三栏Excel表格 …
  • 生字词加拼音注音,其他字不标音,如何快速完成?

    生字词加拼音注音,其他字不标音,如何快速完成?

    使用 拼音注音编辑器 toneoz.com/ime 简单快速可自订中文生字词的筛选及标音。也可用内建的中文检定考HSK(汉语水平考试)及TOCFL(华语文能力测验)分级生词表, 将同级词语的标音一起显示或隐藏。 本文提供三种情境的作法范例,每个范例都可以在10秒内快速完成整篇文章生词筛选: 学过的初级字隐藏标音:123级「字」不标音,其他标音 没学过的生字词才标音:其他不标音,456级「词」标音 自己指定要标音的字词:其他不标音,指定「字」才标音 首先请在 …
  • 澳声通注音拼音TrueType字型。标准楷书、可自动选多音字。

    澳声通注音拼音TrueType字型。标准楷书、可自动选多音字。

    提供繁简笔顺两版本字型,拼音注音互通,免费商用授权,满足中文现场教学需求, 搭配「免费免安装」的多音字自动选音工具: 多音字选音编辑器https://toneoz.com/ime 使用范例 教学影片 简体字版使用教学 https://toneoz.com/blog/2021/10/07/kai-font/ 拼音鼎楷-简 拼音库楷-繁 大拼音鼎楷-简 …
  • 澳声通拼音楷体。标准楷书、可自动选多音字的TrueType拼音字型

    澳声通拼音楷体。标准楷书、可自动选多音字的TrueType拼音字型

    提供四套可免费商用的繁简楷体字型,满足中文现场教学需求 , 搭配「免费免安装」在线选音工具: 多音字选音编辑器https://toneoz.com/ime  繁体字版使用教学 https://toneoz.com/blog/2021/10/14/zhuyinkai/ 拼音鼎楷-简 拼音库楷-繁 以上两种拼音大小适当不影响字距,适合文章阅读或试卷。 另外两种拼音加大的版本,适合投影片或标题。每个字的拼音宽度不同,最短的只有一个字母,最长的字「装zhuāng」有6个字母,大拼音字型的拼音此时可能会重叠,使用者可利用字距或者加入空白来调整。 …
  • 3623个日本汉字与繁体字形笔画差异:用思源黑体分析繁体常用4808字

    3623个日本汉字与繁体字形笔画差异:用思源黑体分析繁体常用4808字

    本文接续前文「思源黑体分析繁体简体字形笔画」: https://toneoz.com/blog/2021/09/21/2275strokediff/ 以下资料同样为思源黑体分析繁体常用4808字,但改为比较日本版与繁体版, 结果发现有3623字有差异, 其中包含笔画不同或者是日文缺字的部分: 编号(1~4808) /汉字/ 繁体中文 / 日文汉字 …

App Translate? Good idea but not enough

This poster has been posted everywhere in Sydney, Paddy Market. A translation App that supposed to help visitors and tourists. Apparently no one noticed the most important thing: maybe the translation works, but the Chinese FONT is missing!

Fortunately there were not too many tourists during the pandemic.

And in the market there are other more interesting things to check on the walls, who cares the boring poster?

Read More

两岸中文语音差很多吗? 数据显示:可能只差3%

台北学生的100分满分国语注音考卷,改交给北京的普通话拼音老师来批阅,得分可能会下修为97分。经过比对17万词,结果显示约有 3% 左右的中文词汇,大陆与台湾教育部分别规定了不同的标准发音。

普通话与国语,语音差多少?其他研究:
用「字」来计算,13~38%

关于两岸教育部官方制定的中文发音差异,过去有许多学者做过论文研究,像是「海峡两岸字音比较 (李青梅 1992)」,「两岸语音规范标准之差异探悉 (南基弘 2008)」等。

受限于能取得的资料有限以及人工比对的耗时,大部分研究是以数目等级2万左右的「字」为基础单位进行比对。例如:南基弘在「两岸语音规范标准之差异探悉 」中提到「…将大陆 1988年公布的《现代汉语通用字表》(包含常用 字 2500 个及次常用字 1000 个)共 7000 字与台湾教育部所公布之常用字 (4808 个)、次常用字(6343 个)、罕用字(18388 个)作全面性交叉对比…」。

专家学者先找到「字」的规范发音差异,再从「字」中找出数个范例「词」来加以佐证。

例如:「绩/绩」这个字大陆跟台湾念法不同,大陆念声调四声 (jì ㄐㄧ\),台湾念一声 (jī ㄐㄧ),大部分的论文会举例「成绩」这个词作为发音差异范例。

大部分研究最后会计算出一个百分比来量化普通话与国语的语音差异「字数」,例如下表。

这相当于每讲十个字就会有1~2个字语音不同,算是很巨大的差异。但是随着华语世界的交流越来越频繁,普通话的朋友听着国语流行歌,国语的观众看着普通话的连续剧,似乎 “13~38%” 这样的差异数据有点夸张。如果真的有这么大的差异,一张满分100分的小学生国文拼音考卷,到了对岸不就可能会变成剩62分?

为何日常对话觉得差别不大?ToneOZ研究:
全辞典比对,差异只约3%

「ToneOZ澳声通」尝试使用另一个角度来分析这个问题:改用十倍以上数目等级的「词」为基础单位进行比对。中文「字(characters)」在组成「词(words)」以后才有更多语意,并能进一步组成句子,每个「字」在不同的词中也会有不同的语音,「字」「词」在生活对话中的出现频率也不相同,以「词」为单位可以更加反映出语音差异真实情况。

2021年我们以三个不同的汉语词库为基础(英汉辞典CC-CEDICT, 大陆Jeiba分词系统, 台湾国语辞典简编本), 比对 17万 个中文词汇的普通话与国语。 经过逐一校对后,我们找到 六千多个词有语音差异,来自 513 个中文字。以2021-02-22为止的数据为例:170,580个词汇中,6,623个词存在语音差异,百分比为 3.88%。

然而17万词是包含少用生僻的词汇,与真实生活中的中文词汇有差距。为了找出日常生活常用中文词汇,我们利用两种澳洲常见的中文能力检定考试词库来做筛选:「汉语水平考试 5000词 (HSK)」及「华语文能力测验 1万4千词 (TOCFL)」,两者都是设计给母语非中文的学生来学习汉语。统计得到的数据如下表:

我们可以看出,经过HSK与TOCFL的筛选,得出的百分比都接近 3%,让我们对这个数据更有信心。如果我们只考虑最基本的日常生活用语,考生只需要通过HSK3级或TOCFL4级检定即可,则差异百分比又会下降到 1%左右。

这呼应了本文开头的情境模拟:两岸的普通话与国语,发音有不同,不过差异不大,日常生活对话偶而遇到1%发音不同,也许会被认为是方言而忽略,就算是参加专门考字词发音的考试,对最后的结果影响也有限。但如果你是专门教授华语中文老师,了解这些语音差异可以让你的教学多一些有趣的话题也更加专业。

ToneOZ.com/Data 有17万词, 能从整句中文分析出哪些字有两岸语音差异,同时提供索引汉语检定考试中普通话与国语的差异音字。

延伸阅读

两岸发音差异「幢」「古蹟」「除夕」

两岸发音差异, 分享一些从老师们的查询观察到的有趣数据:

  1. 」: 最准确抓错
    https://toneoz.com/data/?mode=word&diff=only&instr=%E5%B9%A2

    有三位老师进网站第一件事就是查询「幢」这个字,果然是高手,马上打中要害^^。「幢」在大陆语音是 (zhuàng ㄓㄨㄤ\), 在台湾是 (chuángㄔㄨㄤ/) , 是常用语,”汉语水平测试”及”华语文能力测验”都有。 一开始 ToneOZ资料库 查不出来这个字, 现在已经修正。这是因为原始资料来源 MDBG 英汉字典缺乏「幢」两个字以上词语范例,而且刚好两种语音都有列在字典中。

  2. 滑稽」:以为两岸语音不同,其实一样
    https://toneoz.com/data/?instr=%E6%BB%91%E7%A8%BD
  3. 古蹟」:相反。以为两岸语音一样,其实不同
    https://toneoz.com/data/?instr=%E5%8F%A4%E8%B9%9F

查询这两个词的老师经验丰富。小学老师都会特别叮咛「滑稽(huá jī ㄏㄨㄚ/ ㄐㄧ)」要唸成(gǔ jī ㄍㄨv ㄐㄧ)。「滑」这个字的语音,在两岸规范是相同的:平常口语中唸 huá , 古代文言文场合才唸 gǔ。ToneOZ资料库 是为了现代日常汉语会话设计的,所以「滑稽」会显示为(huá jī ㄏㄨㄚ/ ㄐㄧ)且两岸相同音。

「古蹟」就很有趣了:简体字是「古迹」,「迹」大陆审音表规定唸四声(jìㄐㄧ\), 台湾唸一声(jī ㄐㄧ),确实有语音差异。然而Google繁简转换程式资料错误,繁简都显示为一声(jī ㄐㄧ),再加上相似音「滑稽」的影响,相信就算是老师自己也会迟疑一下。

  1. 除夕」:最应景语音差异
    https://toneoz.com/data/?instr=%E9%99%A4%E5%A4%95

马上要过农历新年了,老师们上课时是怎么唸「除夕」呢?大陆习惯唸一声 (xī ㄒㄧ), 台湾习惯唸四声 (xì ㄒㄧ\),「除夕」也是”汉语水平测试”及”华语文能力测验”都有的常用语喔!
ToneOZ资料库 有17万词, 能从整句中文分析出哪些字有两岸语音差异,同时提供索引 511 个普通话与国语的差异音字。

Latest Posts 最新文章

  • 文章的「字」自动分组成「词」表格,贴入Excel, WordWall, 或Quizlet

    文章的「字」自动分组成「词」表格,贴入Excel, WordWall, 或Quizlet

    中文的「词」是由多个「字」组合而成,许多情境都会需要将一整段文章「分词」来制作教材。 使用 拼音注音编辑器 toneoz.com/ime 自动分词 ToneOZ的分词功能是使用内建的 17万词辞典,词库涵盖两岸教学字典、检定考HSK(汉语水平考试)、及TOCFL(华语文能力测验),适合教材制作,全自动处理省时又简单。 以下范例示范如快速将整篇中文文章分词,汇出到Microsfot或Google试算表、Quizlet或WordWall互动教材工具。范例汇出时用到的软体均为举例,实际使用时老师们可自行灵活更换: 整篇文章自动分词,做成中文 、拼音 、注音三栏Excel表格 …
  • 生字词加拼音注音,其他字不标音,如何快速完成?

    生字词加拼音注音,其他字不标音,如何快速完成?

    使用 拼音注音编辑器 toneoz.com/ime 简单快速可自订中文生字词的筛选及标音。也可用内建的中文检定考HSK(汉语水平考试)及TOCFL(华语文能力测验)分级生词表, 将同级词语的标音一起显示或隐藏。 本文提供三种情境的作法范例,每个范例都可以在10秒内快速完成整篇文章生词筛选: 学过的初级字隐藏标音:123级「字」不标音,其他标音 没学过的生字词才标音:其他不标音,456级「词」标音 自己指定要标音的字词:其他不标音,指定「字」才标音 首先请在 …
  • 澳声通注音拼音TrueType字型。标准楷书、可自动选多音字。

    澳声通注音拼音TrueType字型。标准楷书、可自动选多音字。

    提供繁简笔顺两版本字型,拼音注音互通,免费商用授权,满足中文现场教学需求, 搭配「免费免安装」的多音字自动选音工具: 多音字选音编辑器https://toneoz.com/ime 使用范例 教学影片 简体字版使用教学 https://toneoz.com/blog/2021/10/07/kai-font/ 拼音鼎楷-简 拼音库楷-繁 大拼音鼎楷-简 …
  • 澳声通拼音楷体。标准楷书、可自动选多音字的TrueType拼音字型

    澳声通拼音楷体。标准楷书、可自动选多音字的TrueType拼音字型

    提供四套可免费商用的繁简楷体字型,满足中文现场教学需求 , 搭配「免费免安装」在线选音工具: 多音字选音编辑器https://toneoz.com/ime  繁体字版使用教学 https://toneoz.com/blog/2021/10/14/zhuyinkai/ 拼音鼎楷-简 拼音库楷-繁 以上两种拼音大小适当不影响字距,适合文章阅读或试卷。 另外两种拼音加大的版本,适合投影片或标题。每个字的拼音宽度不同,最短的只有一个字母,最长的字「装zhuāng」有6个字母,大拼音字型的拼音此时可能会重叠,使用者可利用字距或者加入空白来调整。 …
  • 3623个日本汉字与繁体字形笔画差异:用思源黑体分析繁体常用4808字

    3623个日本汉字与繁体字形笔画差异:用思源黑体分析繁体常用4808字

    本文接续前文「思源黑体分析繁体简体字形笔画」: https://toneoz.com/blog/2021/09/21/2275strokediff/ 以下资料同样为思源黑体分析繁体常用4808字,但改为比较日本版与繁体版, 结果发现有3623字有差异, 其中包含笔画不同或者是日文缺字的部分: 编号(1~4808) /汉字/ 繁体中文 / 日文汉字 …