[分享] [NVDA addon] WorldVoice 5.0 語音附加元件 - 討論區

[分享] [NVDA addon] WorldVoice 5.0 語音附加元件

文章瀏覽次數 15477 文章回覆數 183

tsengwoody

tsengwoody圖像(預設)

2020-06-14 21:32:14

From:220.135.204.66

可參考 Eureka 撰寫之教學文,感謝 Eureka 用心的整理

WorldVoice 使用指南

隨著全球化的普及,人們接觸多國文字內容的機會也越來越多。無論是學習教材還是休閒閱讀,我們經常可以看到不同語言混合使用,甚至在同一句話中出現中英日多種語言文字的情況。

各類數位內容(例如語言教材、數理資訊或文學作品)在文字結構、上下文脈絡和語言混用頻率上都會有所不同,因此使用螢幕閱讀器時,能夠根據內容特性與個人喜好靈活調整朗讀方式是一項非常重要的功能。

WorldVoice 是一款 NVDA 附加元件,支援 Espeak、OneCore、RHVoice 及 SAPI5 等不同語音引擎角色之間的自動切換,並提供各式各樣的客製化設定。使用者可依照不同情境及個人偏好,輕鬆調整語音設定。

功能特色

  • 支援各語音角色獨立調整速度、音調與音量。
  • 支援各種語音引擎的語音角色自動切換。
  • 提供數字朗讀方式調整(數值模式或數字模式)。
  • 可設定不同情境下語音停頓長度,包括數字之間、項目之間、中文之間,以及全文朗讀間的停頓。
  • 根據 Unicode 字元自動偵測語言。

語音角色

在 WorldVoice 的語音角色設定面板中,您可以為不同語言設定專屬的語音角色,並針對每個角色個別調整速度、音調和音量等參數。

WorldVoice 會獨立儲存每個語音角色的設定值,切換角色時會套用相應的參數,讓語音角色能擁有各自的速度、音調與音量,這項功能特別有助於閱讀非母語的內容。

  • 選擇一個地區語言後,語音列表會顯示該地區可用的語音角色。選擇某個語音角色即可完成該地區與語音角色的對應關系。
  • 選擇語音角色後,如果該角色支援變聲,將會顯示可用的變聲選項供使用者選擇。
  • 選定語音角色後,速度、音調、音量滑桿,以及加快語速的核取方塊將自動調整到該角色的設定值。調整設定值只會影響當前選定的語音角色(各個語音角色擁有各自獨立的設定值)。
一致性設定:
  • 保持主要語音引擎與地區語音引擎一致:啟用後,主要語音角色與地區語音角色將只能是同個語音引擎下的語音角色。若調整主要語音角色時,發現地區語音角色原屬不同語音引擎,則該地區的語音角色會回復成未選擇狀態,並僅可重新選擇與主要語音角色相同引擎下的語音角色。
  • 保持主要語音角色與地區語音角色一致:啟用後,主要語音角色與地區語音角色將保持一致。當您調整其中一方的語音角色設定時,另一方將自動同步為相同的語音角色。
  • 保持不同語音角色之間的參數一致:啟用後,各語音角色之間的速度、音調、音量及加快語速參數將保持一致。調整任何一個語音角色的設定值,所有其他語音角色的設定值都會同步更新。

主要語音角色是透過 NVDA 語音設定面板設定的,而地區語音角色則是透過 WorldVoice 的語音角色設定面板設定的。

語音流程

透過 WorldVoice 的語音流程設定面板,您可設定各種語音流程的數值,並選擇語音流程作用的範圍(全域或僅限 WorldVoice)。

  • 支援全域的語音流程:忽略在數字間的逗號、數字模式、項目間停頓、數字間停頓、中文間停頓、讀出全部間停頓

  • 僅支援 WorldVoice 的語音流程:根據 Unicode 字元偵測語言、數字語言

  • 根據 Unicode 字元偵測語言:啟用後將根據文字 Unicode 自動判斷語言地區並切換語音角色。注意:此功能可能與 NVDA 的自動語言切換功能衝突,建議避免同時啟用。

  • 數字語言:朗讀數字時,使用此選項設定的地區角色進行朗讀

  • 數字模式:

    • 數值模式:將數字作為數值朗讀,例如「12345」會讀作「一萬兩千三百四十五」。
    • 數字模式:逐字朗讀數字,例如「12345」會讀作「一二三四五」。
  • 語音停頓調整:設定數字之間、項目之間、中文之間與全文朗讀之間的停頓時間,數值越小停頓越短,0 為不停頓。

  • 忽略數字間的逗號:朗讀數字時忽略數字間逗號,以提高特定的語音角色朗讀數值的正確性。

支援全域的語音流程設定可透過 NVDA 的語音設定面板或 WorldVoice 的語音流程面板進行調整。而不支援全域的語音流程設定則僅能透過 NVDA 的語音設定面板進行調整。

Unicode 偵測

  • 偵測語言時忽略數字:勾選後,數字將忽略偵測,並使用當前的語音角色進行朗讀。
  • 偵測語言時忽略常見標點符號:勾選後,標點符號將忽略偵測,並使用當前的語音角色進行朗讀。
  • 語言偵測時間點:決定何時根據 Unicode 的語言偵測和語言切換指令是在 NVDA 處理語音指令之前還是之後。
  • 字元集假設的語言:為 unicode 中多重語言共用的字元集(包括拉丁字元、中日韓字元、阿拉伯字元)設定預設的語言。

注意

若您想停用特定的語音引擎,請在 WorldVoice 語音引擎面板中取消勾選相應的核取方塊。

若您需要使用 RHVoice 語音引擎,請額外從 RHVoice 官方網站下載相應的語音包附加元件。

WorldVoice 更新日誌

WorldVoice v5.0 更新

  • 新增功能及設定面板: 語音流程和日誌記錄
  • 移除已棄用的功能和設置面板: Unicode 正規化、數字-點替換以及其他過時的設定項目
  • 新增語音流程功能: 為所有合成器啟用 WorldVoice 的語音流程
  • 新增日誌記錄功能: 捕獲每個流程前後的語音序列,以便於除錯
  • 新增語速加倍功能: 允許為特定語音引擎啟用語速加倍
  • 增強使用者體驗: 改進語音引擎和日誌記錄對話方塊中的互動體驗
  • 修訂介面文本: 更新介面文本以統一風格

WorldVoice v4.0 更新

  • 將 Espeak 引擎整合到 WorldVoice 支援的引擎中。
  • 在 NVDA 的語音設定面板中增加語速加倍設定項目。
  • 在 NVDA 的語音設定面板中增加語音變聲設定。
  • 如果當前引擎或語音支援語速加倍,NVDA 的語音設定面板將動態顯示語速加倍的設定介面。
  • 使用者可以在 WorldVoice 的語音設定面板中為單個語音設定語速加倍。
    ※最後更新時間:2025-06-17 21:56:00 From:114.34.171.68 By:tsengwoody

留言

#1

小羔羊

小羔羊圖像(預設)

2020-06-15 20:48:42

From:114.34.88.168

讚讚讚啊,好務

#2

此篇留言已被刪除。

#3

小羔羊

小羔羊圖像(預設)

2020-06-15 21:59:06

From:114.34.88.168

請問第四步和第五步為什麼我在nvda設定的語音裡沒看到?還是要從其他地方打開面板?感謝

#4

光明之子

光明之子圖像(預設)

2020-06-16 06:38:44

From:101.12.172.146

重新啟動nvda,在nvda功能表鐘就能發現multiple world-voice選單了,不過它的功能跟nvda本身的自動語言偵測一曲同工,可惜了。

#5

tsengwoody

tsengwoody圖像(預設)

2020-06-18 16:01:29

From:220.135.204.66

更新功能與說明內容

#6

阿慶

阿慶圖像

2020-06-18 17:21:26

From:211.23.21.202

剛剛發現如果把數字模式設定成中文數字,他只會單純把數字讀出來。
是否可以讓她讀「數值」呢?12345讀「一萬兩千三百四十五」。
不然包括時間他也唸成「下午 零五 二零」了。

#7

阿慶

阿慶圖像

2020-06-18 17:22:27

From:211.23.21.202

會不會改著改著,功能越來越多,最後就跟星光雙語一樣了XD

#8

tsengwoody

tsengwoody圖像(預設)

2020-06-19 18:33:07

From:220.135.204.66

我測數字模式選項調「預設」的就是讀數值了,只是以前的星光雙語是強制用第一或第二語音朗讀,這個是用預設的語音。

#9

特種兵

特種兵圖像(預設)

2020-06-20 13:10:29

From:211.23.21.202

是否能將設定選項都整合在一起會比較方便

#10

此篇留言已被刪除。

#11

cello

cello圖像(預設)

2020-06-20 18:16:39

From:219.85.178.184

好極了

#12

此篇留言已被刪除。

#13

tsengwoody

tsengwoody圖像(預設)

2020-06-21 16:08:56

From:220.135.204.66

Hello,

關於整合設定的部份
主要是 NVDA 語音設定介面比較不好客製,所以有些較複雜的功能(自動語言切換設定、語音速度設定)才會獨立出來做視窗
而沒將切換設定與速度整合是不希望動太多原先 VE driver 的內容,獨立性較高,如此如果未來 VE driver 有更新時要同步合併會比較好處理,而且其實 2 個視窗行為不太一羕,語速那個是拉滑桿就生效,但切換是要按確定才會生效

Woody

#14

江餅人jph

江餅人jph圖像(預設)

2020-06-22 10:34:14

From:1.34.216.251

我這邊測試後發現,若將數字朗讀模式選擇為預設,一般情況下,語音會以中文數值朗讀,但若是在 word 打上一串數字,就又會變為英文語音朗讀了

#15

tsengwoody

tsengwoody圖像(預設)

2020-06-26 22:09:56

From:220.135.204.66

研究了一下在 word 數字會用英文朗讀的原因,目前看來主要是 word 會自帶文字的語言地區標記, NVDA 會讀取這些資訊並傳給語音合成器。
而 VE 實做上就是會根據這些標記去切換朗讀語音,會試著開發當遇到數字強制使用特定語音朗讀的功能。
也有看了一下星光雙語的做法,不過它只需處理雙語音,所以用的方式比較不用考慮擴充性,寫法彈性較低,做法比較不適合用於需考量多語音切換的情境。