[分享] 落寞OCR工具更新,影片、音訊轉文字功能上線啦 - 討論區

[分享] 落寞OCR工具更新,影片、音訊轉文字功能上線啦

文章瀏覽次數 156 文章回覆數 20

小羔羊

小羔羊圖像(預設)

2021-10-09 10:12:02

From:114.34.171.78

大家好,
落寞OCR工具有新功能更新了,其實未來應該會改名字,功能不僅限於OCR了,
這次新增了影片、音訊轉文字的功能,使用的是阿李雲的語音轉文字的付費接口,支援多語言,
要是有英文、日文等等的外語影片、音訊,都可以透過這個功能來轉成文字,加上工具裡的翻譯功能,批量將這些識別出的結果轉為中文,就能輕鬆的閱讀啦,
還有很多細節功能,例如在某句識別出的文字上按enter,還能直接撥放那一段的說話聲,
或是將識別結果導出為影片字幕檔或歌詞檔又或是文字檔都可以,
你也可以在某段識別出的文字上將那一段文字對應的聲音導出為音訊檔,非常方便。

  • 下面是作者的操作演示錄音
    點我下載操作演示錄音
  • 最後是作者的原始公告
    落寞OCR电脑版新增语音转文本,支持普通话、英语、日语、德语等,支持通用、电话、教育授课等特定领域识别,可将音视频中的语音都转换成文本,支持翻译、导出成视频字幕、外挂歌词等,从此无论是整理会议笔记、收看国外电影都不是梦!
    哪些场景下会用到此功能?
    (1)想看国外电影,但苦于没有中文字幕,那此功能可以直接将音视频中的语音转换成文本,支持一键翻译、导出成外挂字幕文件,配合PotPlayer这类可朗读字幕的播放器,从此收听国外节目不是梦!
    (2)听到一首国外歌曲,但没有相对应的中文歌词,那此时就可以将识别结果导出成外挂歌词文件,配合可朗读歌词的播放器,一边听歌一边看歌词。
    (3)经常需要整理会议笔记、课堂录音等,识别出的结果直接用列表显示,并且可以直接回车播放此结果对应的音频段,方便你改错纠正,最终结果可直接导出成txt。
    使用步骤:
    (1)点击托盘图标,选择语音转文本,进入语音转文本界面。
    (2)tab键浏览到选择识别文件按钮,回车后弹出选择文件对话框,支持常见音视频文件。
    (3)tab键浏览选择要用来识别的语言以及引擎,确认无误后点击提交,此时就会开始上传文件至服务器中,如果选择的是视频文件,还会进行音频转换,请耐心等待。
    (4)等提示上传成功后,可在语音转文本界面中查看到刚上传的文件,并且会显示出当前的识别状态,如果提示识别中,请耐心等待,根据文件的大小时长等信息,识别所用时间也会不同。
    (5)提示识别完成后,可回车查看具体识别结果,识别结果会已列表显示,右键菜单中还可以进行编辑、复制、翻译、导出等。
    更多介绍及掩饰,可在官方群共享中下载掩饰录音收听~
    官方QQ群:
    554346279
    另外也有line群,為了避免廣告進群亂發廣告,有興趣的可以在視障電腦群愛特小羔羊,或是在下方留言,我在私訊拉你進來喔!
    注:此服务采用第三方付费接口,在线识别,因此使用此功能需开通会员使用,消耗积分为1小时音视频,消耗五百积分,不满1小时,会按照比例扣除相对应积分,最低消耗1积分。
    ※最後更新時間:2021-10-09 10:13:30 From:114.34.171.78 By:小羔羊

留言

#1

Maxe

Maxe圖像(預設)

2021-10-09 12:10:56

From:36.230.221.182

我不捨得用,對我來說,積分用來 OCR 最有價值,其他的用了都是浪費。

#2

小羔羊

小羔羊圖像(預設)

2021-10-10 12:54:09

From:114.34.171.78

如果有很想學習的外語資料的話,這是唯一的解決方案了

#3

torrent

torrent圖像(預設)

2021-10-16 02:35:41

From:60.198.179.67

其實,我最近有發現,用兩款小軟體,體積都不大,這樣不但可以抽取mkv雙語影片的音軌分別保存,還能抽取字幕,因為在自己店腦上處理,可以省下影片傳輸的時間呢!有興趣我再說吧,因為這方法好用歸好用,前置作業還是挺麻煩的。雖然只需做一次啦!

#4

米津旋詩

米津旋詩圖像(預設)

2021-10-16 11:43:38

From:219.71.63.68

請問撥放器除了POTPlayer之外,還有其他的撥放器可使用嗎?

#5

小愛

小愛圖像(預設)

2021-10-16 18:58:54

From:111.241.119.252

播放工具可以用Calliope,這是一個專門設計給視覺障礙用戶的媒體播放軟體

#6

小愛

小愛圖像(預設)

2021-10-16 18:59:52

From:111.241.119.252

https://www.nathantech.net/products/software/calliope.php

#7

Maxe

Maxe圖像(預設)

2021-10-16 22:03:53

From:36.230.201.74

能不能詳細說說 Calliope 的特色呢?

#8

Maxe

Maxe圖像(預設)

2021-10-17 00:00:07

From:36.230.201.74

話說不知道有沒有手機可以播放影片同時自動念字幕的 App呢 ?
我不會寫 App 所以用 HTML + JS 寫了一個網頁,讓使用者自己選擇本地影片與字幕檔案,然後再播放影片時,讓螢幕導讀軟體自動讀出當前字幕,在電腦 Chrome 執行非常順利,但是在 iPhone 卻失敗了,所以目前還是能找到 App 最好。

#9

小愛

小愛圖像(預設)

2021-10-17 17:56:02

From:111.241.119.252

calliope就一個普通的播放工具,然後可以播放和下載yt影片並轉換成mp3,可以閱讀電子書,介面目前沒有中文只有英文,開發者是有開發許多視障最佳化軟體,例如檔案備份、鬧鐘、行事曆、遊戲和一些有的沒的。

#10

小愛

小愛圖像(預設)

2021-10-17 17:56:48

From:111.241.119.252

閱讀字幕我不知道,尤其是蘋果的,我用android也沒有特別知道相關的。

#11

米津旋詩

米津旋詩圖像(預設)

2021-10-18 01:20:23

From:219.71.63.68

感謝小愛,沒中文實在有點傷腦筋的說,英文要來研究了一翻啦!

#12

coscell

coscell圖像(預設)

2021-10-18 05:06:36

From:123.193.252.152

8f 可以研究 NativeScript

#13

Maxe

Maxe圖像(預設)

2021-10-18 10:13:25

From:211.23.21.202

我看 NativeScript 並不知員在 Windows 建立編寫 iOS App 的環境:
Environment Setup | NativeScript

#14

Maxe

Maxe圖像(預設)

2021-10-18 12:14:04

From:211.23.21.202

to torrent: 你說的是 MKV ToolNix 嗎?
MKV 內掛字幕,可以在 Pot Player 一邊播影片,一邊透過 UIA 讓 NVDA 念出字幕,依照我 NVDA 的語速,是來得及在每一句對話結束前唸完字幕的,我都是這樣子看動畫的。
這次落寞 OCR 更新所針對的是內嵌字木,注意不是像 MKV 把字幕檔案放到裡面去這種內掛字幕,是直接在影像裡面塞字幕進去,這種才需要透過螢幕辨識來獲得不完全正確的文字。
P.S 影片還是 mp4 且室內嵌字幕的比較多,是 mkv 且室內掛字幕的影片,這兩個條件加起來少之又少。

#15

小羔羊

小羔羊圖像(預設)

2021-10-19 07:20:35

From:114.34.171.78

這次落寞的更新,不是透過螢幕ocr來看到字幕的,是用語音轉文字的技術,有點像聽寫這樣,支援的雨戲也很多,好像連閩南語、廣東話都有