NASA is landing on Mars!

Mastcam-Z, a zoomable pair of cameras aboard NASA’s Perseverance Mars rover, is getting magnificent images from Mars, after its successful landing in 18/Feb/2021.

NASA has posted a 360 degree panorama photo on their website:
https://www.nasa.gov/image-feature/jpl/mastcam-z-s-first-360-degree-panorama

Mars (火星 huǒ xīng)

Landing (登陆 dēng lù)

Read More

  • 兩岸字形筆畫比對 :用思源黑體分析繁體常用4808字

    兩岸字形筆畫比對 :用思源黑體分析繁體常用4808字

    本文利用比對「思源黑體Noto Sans」的 “繁體TC” 與 “簡體SC” 版,來找出兩岸中文字形中,有多少字是電腦編碼相同但是筆畫存在差異?先講答案:繁體4808個常用字中,有「2275」個 思源黑體 字在兩岸同編碼但字形筆畫有差異 。 我們都知道中文有繁體字與簡體字,例如「聲(unicode …
  • 澳声通拼音文楷。免费、美观、可选多音字的TrueType拼音字型

    澳声通拼音文楷。免费、美观、可选多音字的TrueType拼音字型

    这是一款基于「FONTWORKS Klee One」以及「LXGW 霞鹜文楷」的中文字体,搭配「免费免安装」在线多音字选音工具: 多音字选音编辑器 https://toneoz.com/ime  「表意文字变体多音字选择器」的概念来自But Ko的「注音IVS字型规格」。 字型下载请点这里「澳声通拼音文楷 ]SIL Open …
  • 拼音字型「多音字自动修正工具」支持 Office可贴上内嵌拼音资讯的纯文字、金山文档可贴上输出图档。

    拼音字型「多音字自动修正工具」支持 Office可贴上内嵌拼音资讯的纯文字、金山文档可贴上输出图档。

    在线工具網址 ToneOZ.com/ime 本文介绍「自动多音字拼音校正」的「拼音字型输入工具」ToneOZ.com/ime , 能够将内嵌拼音资讯的纯文字(IVS字型)贴到Office,省下大量排版及破音字校正的时间。 IVS選音工具 is designed by ButKo. 特色 …
  • 拼音注音編輯器IVS字型工具,輸入瞬間即時自動修正多音字。 Office可貼上內嵌拼音資訊的純文字,Google Doc可貼上輸出圖檔。

    拼音注音編輯器IVS字型工具,輸入瞬間即時自動修正多音字。 Office可貼上內嵌拼音資訊的純文字,Google Doc可貼上輸出圖檔。

    編輯器網址:ToneOZ.com/ime 本文介紹「自動多音字拼音校正」的「拼音字型輸入工具」ToneOZ.com/ime , 能夠將內嵌拼音資訊的純文字(IVS字型)貼到Office,省下大量排版及破音字校正的時間。 特色 即時系統,輸入時瞬間自動多音字拼音校正。 可手動訂正拼音 相容所有軟體。Office,線上文書軟體,手機APP…全部相容 可圈選隱藏部分字詞的拼音 免費商用、支援Web Font免安裝 …
  • ピンインフォント拼音字型  多音字自動修正入力ツール。

    ピンインフォント拼音字型 多音字自動修正入力ツール。

    「Win/Mac Office」から「携帯アプリ」まで、ピンイン付ける漢字を入力 ♪~ ToneOZ.com/ime 新しいツール「拼音IVS字型輸入工具」ToneOZ.com/ime を紹介します。 中国語の場合、同じ漢字でピンイン(拼音)が異なることがあります。このツールで中国語を入力したあと、多音字を自動/マニュアルで修正することができます。 ★おすすめポイント★ 入力したあと、すぐに多音字のピンインが自動的に修正されます 意味による音を修正できる …

The 3% diff pronunciations in Chinese Mandarin between Mainland and Taiwan

Given 100 questions, a Pinyin student answered all correctly, but a Zhuyin teacher might only give him a score 97% . Why ?

Mainland Common Tongue (Pǔtōnghuà 普通話) and Taiwan National Language (Guóyǔ 國語)

By “character” : 13~38% Diff

There were many essays related to the topic “Pronunciation differences in Chinese Mandarin between Mainland and Taiwan”. e.g. :

“Comparison of the Chinese pronunciations between Mainland China and Taiwan” (海峽兩岸字音比較) by Qingmei Li (李青梅), 1992

 “A Study of the Distinction of Pronunciation Standards between Taiwan and Mainland China” (兩岸語音規範標準之差異探悉) by Jihong Nan (南基弘), 2008

Most of them are based on “Diff by character” : The 3500 high frequency words specified in “List of Commonly Used Characters in Modern Chinese” (現代漢語通用字表, 1988).

Experts check the differences character by character. While a mismatched pronunciation was found, essays usually provide several example “words / vocabularies” with that character.

E.g.: 绩/績 (means “achievement”) is pronounced differently. In Mainland it is tone 4  (jì ㄐㄧ\), while in Taiwan it is tone 1 (jī ㄐㄧ). As an example, the vocabulary “成绩/成績” :

In this way, a final diff percentage was calculated, based on characters:

“13%~38%” is a large difference. It makes people feel like a student could only get a reduced score of 62%, with his 100% corret study from the other side? A little bit more than realistic.

By “vocabularies” : 3% Diff

In stead of only compare the 3500 characters, ToneOZ tried a new way : To compare all 170,000+ words / vocabularies in the dictionary. The Chinese characters are pronounced differently after they are combined into words / vocabularies, this should give us some data from a different point of view.

By “vocabularies”, there are 513 characters from around 6K words/vocabularies have been identified with different pronunciation between the Common Tongue and the National Language. It is based on a programmatically comparison and then a manual review for around 170K words/vocabularies from several word banks :

CEDICT (the largest open source Mandarin-English Dictionary)

National Language Mandarin official dictionaries “Applied Modern version Jian-Bian-Ben” (國語辭典簡編本) and “Literature version Zhong-Bian-Ben” (國語辭典重編本) by the Taiwan Ministry of Education)

“Jeiba” Chinese text segmentation database.

The diff rate is 3.88% : In all 170,580 words, there are 6,623 words are pronounced differently.

We also use word banks to filter percentages from “high frequency words” only. In Australia, there are 2 common Chinese certifications:

Chinese Proficiency Test, Hanyu Shuiping Kaoshi
(漢語水平考試 , HSK)

Test of Chinese as a Foreign Language
(華語文能力測驗, TOCFL)

They are both designed for non native Chinese speakers to learn general conversations. As results:

The results filtered by HSK and TOCFL are all close to 3%, which gives us more confidence in this number. And if we filter from basic levels only, the percentage becomes around 1%(For basic conversation ability, HSK level 3 or TOCFL level 4 is required).

In conclusion : There are pronunciation differences in Chinese Mandarin between Mainland and Taiwan, but not too much, only about 3% words are pronounced differently. In general conversation the difference rate could become 1% only. You don’t have to worry too much about these differences if you are learning Chinese.

Toneoz.com/data provides a list for all the Chinese words with pronunciation differences, and it can also check pronunciation differences from a whole Chinese sentence.

Read More

  • 兩岸字形筆畫比對 :用思源黑體分析繁體常用4808字

    兩岸字形筆畫比對 :用思源黑體分析繁體常用4808字

    本文利用比對「思源黑體Noto Sans」的 “繁體TC” 與 “簡體SC” 版,來找出兩岸中文字形中,有多少字是電腦編碼相同但是筆畫存在差異?先講答案:繁體4808個常用字中,有「2275」個 思源黑體 字在兩岸同編碼但字形筆畫有差異 。 我們都知道中文有繁體字與簡體字,例如「聲(unicode …
  • 澳声通拼音文楷。免费、美观、可选多音字的TrueType拼音字型

    澳声通拼音文楷。免费、美观、可选多音字的TrueType拼音字型

    这是一款基于「FONTWORKS Klee One」以及「LXGW 霞鹜文楷」的中文字体,搭配「免费免安装」在线多音字选音工具: 多音字选音编辑器 https://toneoz.com/ime  「表意文字变体多音字选择器」的概念来自But Ko的「注音IVS字型规格」。 字型下载请点这里「澳声通拼音文楷 ]SIL Open …
  • 拼音字型「多音字自动修正工具」支持 Office可贴上内嵌拼音资讯的纯文字、金山文档可贴上输出图档。

    拼音字型「多音字自动修正工具」支持 Office可贴上内嵌拼音资讯的纯文字、金山文档可贴上输出图档。

    在线工具網址 ToneOZ.com/ime 本文介绍「自动多音字拼音校正」的「拼音字型输入工具」ToneOZ.com/ime , 能够将内嵌拼音资讯的纯文字(IVS字型)贴到Office,省下大量排版及破音字校正的时间。 IVS選音工具 is designed by ButKo. 特色 …
  • 拼音注音編輯器IVS字型工具,輸入瞬間即時自動修正多音字。 Office可貼上內嵌拼音資訊的純文字,Google Doc可貼上輸出圖檔。

    拼音注音編輯器IVS字型工具,輸入瞬間即時自動修正多音字。 Office可貼上內嵌拼音資訊的純文字,Google Doc可貼上輸出圖檔。

    編輯器網址:ToneOZ.com/ime 本文介紹「自動多音字拼音校正」的「拼音字型輸入工具」ToneOZ.com/ime , 能夠將內嵌拼音資訊的純文字(IVS字型)貼到Office,省下大量排版及破音字校正的時間。 特色 即時系統,輸入時瞬間自動多音字拼音校正。 可手動訂正拼音 相容所有軟體。Office,線上文書軟體,手機APP…全部相容 可圈選隱藏部分字詞的拼音 免費商用、支援Web Font免安裝 …
  • ピンインフォント拼音字型  多音字自動修正入力ツール。

    ピンインフォント拼音字型 多音字自動修正入力ツール。

    「Win/Mac Office」から「携帯アプリ」まで、ピンイン付ける漢字を入力 ♪~ ToneOZ.com/ime 新しいツール「拼音IVS字型輸入工具」ToneOZ.com/ime を紹介します。 中国語の場合、同じ漢字でピンイン(拼音)が異なることがあります。このツールで中国語を入力したあと、多音字を自動/マニュアルで修正することができます。 ★おすすめポイント★ 入力したあと、すぐに多音字のピンインが自動的に修正されます 意味による音を修正できる …

App Translate? Good idea but not enough

This poster has been posted everywhere in Sydney, Paddy Market. A translation App that supposed to help visitors and tourists. Apparently no one noticed the most important thing: maybe the translation works, but the Chinese FONT is missing!

Fortunately there were not too many tourists during the pandemic.

And in the market there are other more interesting things to check on the walls, who cares the boring poster?

Read More

兩岸中文語音差很多嗎? 數據顯示:可能只差3%

台北學生的100分滿分國語注音考卷,改交給北京的普通話拼音老師來批閱,得分可能會下修為97分。經過比對17萬詞,結果顯示約有 3% 左右的中文詞彙,大陸與台灣教育部分別規定了不同的標準發音。

普通話與國語,語音差多少?其他研究:
用「字」來計算,13~38%

關於兩岸教育部官方制定的中文發音差異,過去有許多學者做過論文研究,像是「海峽兩岸字音比較 (李青梅 1992)」,「兩岸語音規範標準之差異探悉 (南基弘 2008)」等。

受限於能取得的資料有限以及人工比對的耗時,大部分研究是以數目等級2萬左右的「字」為基礎單位進行比對。例如:南基弘在「兩岸語音規範標準之差異探悉 」中提到「…將大陸 1988年公布的《現代漢語通用字表》(包含常用 字 2500 個及次常用字 1000 個)共 7000 字與臺灣教育部所公布之常用字 (4808 個)、次常用字(6343 個)、罕用字(18388 個)作全面性交叉對比…」。

專家學者先找到「字」的規範發音差異,再從「字」中找出數個範例「詞」來加以佐證。

例如:「绩/績」這個字大陸跟台灣念法不同,大陸念聲調四聲 (jì ㄐㄧ\),台灣念一聲 (jī ㄐㄧ),大部分的論文會舉例「成績」這個詞作為發音差異範例。

大部分研究最後會計算出一個百分比來量化普通話與國語的語音差異「字數」,例如下表。

這相當於每講十個字就會有1~2個字語音不同,算是很巨大的差異。但是隨著華語世界的交流越來越頻繁,普通話的朋友聽著國語流行歌,國語的觀眾看著普通話的連續劇,似乎 “13~38%” 這樣的差異數據有點誇張。如果真的有這麼大的差異,一張滿分100分的小學生國文拼音考卷,到了對岸不就可能會變成剩62分?

為何日常對話覺得差別不大?ToneOZ研究:
全辭典比對,差異只約3%

「ToneOZ澳聲通」嘗試使用另一個角度來分析這個問題:改用十倍以上數目等級的「詞」為基礎單位進行比對。中文「字(characters)」在組成「詞(words)」以後才有更多語意,並能進一步組成句子,每個「字」在不同的詞中也會有不同的語音,「字」「詞」在生活對話中的出現頻率也不相同,以「詞」為單位可以更加反映出語音差異真實情況。

2021年我們以三個不同的漢語詞庫為基礎(英漢辭典CC-CEDICT, 大陸Jeiba分詞系統, 台灣國語辭典簡編本), 比對 17萬 個中文詞彙的普通話與國語。 經過逐一校對後,我們找到 六千多個詞有語音差異,來自 513 個中文字。以2021-02-22為止的數據為例:170,580個詞彙中,6,623個詞存在語音差異,百分比為 3.88%。

然而17萬詞是包含少用生僻的詞彙,與真實生活中的中文詞彙有差距。為了找出日常生活常用中文詞彙,我們利用兩種澳洲常見的中文能力檢定考試詞庫來做篩選:「漢語水平考試 5000詞 (HSK)」及「華語文能力測驗 1萬4千詞 (TOCFL)」,兩者都是設計給母語非中文的學生來學習漢語。統計得到的數據如下表:

我們可以看出,經過HSK與TOCFL的篩選,得出的百分比都接近 3%,讓我們對這個數據更有信心。如果我們只考慮最基本的日常生活用語,考生只需要通過HSK3級或TOCFL4級檢定即可,則差異百分比又會下降到 1%左右。

這呼應了本文開頭的情境模擬:兩岸的普通話與國語,發音有不同,不過差異不大,日常生活對話偶而遇到1%發音不同,也許會被認為是方言而忽略,就算是參加專門考字詞發音的考試,對最後的結果影響也有限。但如果你是專門教授華語中文老師,了解這些語音差異可以讓你的教學多一些有趣的話題也更加專業。

ToneOZ.com/Data 有17萬詞, 能從整句中文分析出哪些字有兩岸語音差異,同時提供索引漢語檢定考試中普通話與國語的差異音字。

延伸閱讀

兩岸發音差異「幢」「古蹟」「除夕」

兩岸發音差異, 分享一些從老師們的查詢觀察到的有趣數據:

  1. 」: 最準確抓錯
    https://toneoz.com/data/?mode=word&diff=only&instr=%E5%B9%A2

    有三位老師進網站第一件事就是查詢「幢」這個字,果然是高手,馬上打中要害^^。「幢」在大陸語音是 (zhuàng ㄓㄨㄤ\), 在台灣是 (chuángㄔㄨㄤ/) , 是常用語,”漢語水平測試”及”華語文能力測驗”都有。 一開始 ToneOZ資料庫 查不出來這個字, 現在已經修正。這是因為原始資料來源 MDBG 英漢字典缺乏「幢」兩個字以上詞語範例,而且剛好兩種語音都有列在字典中。

  2. 滑稽」:以為兩岸語音不同,其實一樣
    https://toneoz.com/data/?instr=%E6%BB%91%E7%A8%BD
  3. 古蹟」:相反。以為兩岸語音一樣,其實不同
    https://toneoz.com/data/?instr=%E5%8F%A4%E8%B9%9F

查詢這兩個詞的老師經驗豐富。小學老師都會特別叮嚀「滑稽(huá jī ㄏㄨㄚ/ ㄐㄧ)」要唸成(gǔ jī ㄍㄨv ㄐㄧ)。「滑」這個字的語音,在兩岸規範是相同的:平常口語中唸 huá , 古代文言文場合才唸 gǔ。ToneOZ資料庫 是為了現代日常漢語會話設計的,所以「滑稽」會顯示為(huá jī ㄏㄨㄚ/ ㄐㄧ)且兩岸相同音。

「古蹟」就很有趣了:簡體字是「古迹」,「迹」大陸審音表規定唸四聲(jìㄐㄧ\), 台灣唸一聲(jī ㄐㄧ),確實有語音差異。然而Google繁簡轉換程式資料錯誤,繁簡都顯示為一聲(jī ㄐㄧ),再加上相似音「滑稽」的影響,相信就算是老師自己也會遲疑一下。

  1. 除夕」:最應景語音差異
    https://toneoz.com/data/?instr=%E9%99%A4%E5%A4%95

馬上要過農曆新年了,老師們上課時是怎麼唸「除夕」呢?大陸習慣唸一聲 (xī ㄒㄧ), 台灣習慣唸四聲 (xì ㄒㄧ\),「除夕」也是”漢語水平測試”及”華語文能力測驗”都有的常用語喔!
ToneOZ資料庫 有17萬詞, 能從整句中文分析出哪些字有兩岸語音差異,同時提供索引 511 個普通話與國語的差異音字。

Latest Posts 最新文章

  • 兩岸字形筆畫比對 :用思源黑體分析繁體常用4808字

    兩岸字形筆畫比對 :用思源黑體分析繁體常用4808字

    本文利用比對「思源黑體Noto Sans」的 “繁體TC” 與 “簡體SC” 版,來找出兩岸中文字形中,有多少字是電腦編碼相同但是筆畫存在差異?先講答案:繁體4808個常用字中,有「2275」個 思源黑體 字在兩岸同編碼但字形筆畫有差異 。 我們都知道中文有繁體字與簡體字,例如「聲(unicode …
  • 澳声通拼音文楷。免费、美观、可选多音字的TrueType拼音字型

    澳声通拼音文楷。免费、美观、可选多音字的TrueType拼音字型

    这是一款基于「FONTWORKS Klee One」以及「LXGW 霞鹜文楷」的中文字体,搭配「免费免安装」在线多音字选音工具: 多音字选音编辑器 https://toneoz.com/ime  「表意文字变体多音字选择器」的概念来自But Ko的「注音IVS字型规格」。 字型下载请点这里「澳声通拼音文楷 ]SIL Open …
  • 拼音字型「多音字自动修正工具」支持 Office可贴上内嵌拼音资讯的纯文字、金山文档可贴上输出图档。

    拼音字型「多音字自动修正工具」支持 Office可贴上内嵌拼音资讯的纯文字、金山文档可贴上输出图档。

    在线工具網址 ToneOZ.com/ime 本文介绍「自动多音字拼音校正」的「拼音字型输入工具」ToneOZ.com/ime , 能够将内嵌拼音资讯的纯文字(IVS字型)贴到Office,省下大量排版及破音字校正的时间。 IVS選音工具 is designed by ButKo. 特色 …
  • 拼音注音編輯器IVS字型工具,輸入瞬間即時自動修正多音字。 Office可貼上內嵌拼音資訊的純文字,Google Doc可貼上輸出圖檔。

    拼音注音編輯器IVS字型工具,輸入瞬間即時自動修正多音字。 Office可貼上內嵌拼音資訊的純文字,Google Doc可貼上輸出圖檔。

    編輯器網址:ToneOZ.com/ime 本文介紹「自動多音字拼音校正」的「拼音字型輸入工具」ToneOZ.com/ime , 能夠將內嵌拼音資訊的純文字(IVS字型)貼到Office,省下大量排版及破音字校正的時間。 特色 即時系統,輸入時瞬間自動多音字拼音校正。 可手動訂正拼音 相容所有軟體。Office,線上文書軟體,手機APP…全部相容 可圈選隱藏部分字詞的拼音 免費商用、支援Web Font免安裝 …
  • ピンインフォント拼音字型  多音字自動修正入力ツール。

    ピンインフォント拼音字型 多音字自動修正入力ツール。

    「Win/Mac Office」から「携帯アプリ」まで、ピンイン付ける漢字を入力 ♪~ ToneOZ.com/ime 新しいツール「拼音IVS字型輸入工具」ToneOZ.com/ime を紹介します。 中国語の場合、同じ漢字でピンイン(拼音)が異なることがあります。このツールで中国語を入力したあと、多音字を自動/マニュアルで修正することができます。 ★おすすめポイント★ 入力したあと、すぐに多音字のピンインが自動的に修正されます 意味による音を修正できる …