登入首頁
收藏 0
返回課程
openai whisper在huggingface的試用與在colab上的使用
  • 生成式AI研討
  • LLM簡介與使用
  • 加入課程請說出對課程的期許
  • 分組
  • 分組
  • 使用Google生成式AI Gemini 詢問程式語言排名 tiobe與IEEE spectrum
  • chatGPT與big data
  • 試用xAI Grok與產生短片
  • LLM?
  • imitationGame
  • LLM簡介之一
  • LLM簡介之二
  • NLP
  • 自然語言處理 Natural language Processing簡介
  • 自然語言處理 Natural language Processing 字詞量化
  • NLP pptx
  • 展示詞嵌入Word Embeddings& TTS.ipynb
  • 恐怖谷,不気味の谷現象,Uncanny Valley
  • Natural language Processing、字詞向量與 TTS之一
  • Natural language Processing、字詞向量與 TTS之二
  • NLP的應用whisper
  • openai whisper在huggingface的試用與在colab上的使用
  • 免費版Openai-whisper超好用---簡介
  • whisper turbo版與large v2版colab GPU語音辨識練習
  • whisper large v3 python轉VTT字幕
  • openai_whisper_ex0.ipynb
  • Ex1
  • 神經網路與mnist, emnist
  • Keras實作神經網路模型之1 mnist手寫數字
  • AI機器學習Keras淺層神經網路辨識mnist手寫數字
  • Keras實作神經網路模型
  • 神經網路模型之一 從感知器到神經網路
  • 神經網路模型.ipynb
  • 神經網路模型_emnist.ipynb
  • 手寫字母數字emnist之神經網路辨識實作
  • CNN與手寫數字、字母
  • CNN卷積計算辨識mnist手寫數字
  • 實作CNN模型辨識mnist.ipynb
  • CNN網路模型_emnist.ipynb
  • CNN卷積神經網路的視覺化解構
  • [用AI學AI]CNN辨識手寫字母EMNIST
  • 生成式AI RAG應用
  • RAG之NotebookLM操作與Keras辨識mnist手寫數字程式
  • 深度學習的 「Hello World」 辨識mnist手寫數字NotebookLM之Podcast
  • 期中報告
  • 期中作業
  • 第一組 期中影片
  • 第二組 |第3_4_5課影片縂整理(M11432009-M11432901期中作業)
  • 第三組影片
  • 生成式AI研討—M11433011
  • 歡迎來到實用_AI:教導機器感知_M11433002_簡日昌
  • YOLO
  • YOLO26x AI 眼中的牠是貓?黑柴表示:我太難了
  • YOLO26在Colab Python上試做之1
  • YOLO26在Colab Python上試做畫面分割、姿態檢測與隨機狗辨識
  • YOLO code
  • YOLO-world
  • 為什麼黑柴和魯夫會變綠?帶你解析 YOLO-seg 的神奇分割技術與趣味翻車現場
  • 黑柴心很累 擋路的是虎式坦克,AI 竟然不認識?
  • 告別誤判為貓?YOLO-World 實測:黑柴成功認出,但戰車卻徹底翻車?
  • AI 影像辨識黑科技:YOLO-World 實測,連黑柴與戰車都能精準偵測?
  • YOLO好用2.ipynb
  • 安裝YOLO相關軟體與辨識影片用VideoWriter燒錄
  • 期末報告
  • 期末
  • open claw簡介與AI代理
  • 生成式ai的多元應用-第三組
  • 重點
  • 討論 (1)
  • 共享筆記 (1)
  • 筆記
發表時間 : 2024-12-01 22:24
觀看次數 : 50
原始資料來自 : https://www.youtube.com/embed/8gsdsRgEiug?si=9AyRphbl5WcBWpdW
附件
討論功能僅開放給課程成員,請先加入課程
最新的回應 ...more
04-09
m11433004 : Whisper 是由 OpenAI 開發的一款自動語音辨識(ASR)模型。它主要的功能是將「語音轉成文字」,並具備翻譯功能。
03-24
鄧萱琳 : Whisper 是由 OpenAI 開發的一款開源自動語音辨識(ASR)系統。簡單來說,它是一位聽力極佳且精通多國語言的數位速記員。它能將音檔或影片中的對話精準地轉譯成文字(逐字稿),甚至直接進行翻譯。比起傳統的辨識軟體,Whisper 最厲害的地方在於它對背景雜音、不同口音以及專有名詞的處理能力極強,是目前學術研究與影音創作領域中,公認最強大的語音轉文字工具之一。
03-24
武氏金英 : Whisper 是由 OpenAI 開發的語音辨識AI模型,主要功能是將語音轉換為文字,並支援多語言辨識與翻譯。它能應用於會議錄音整理、影片字幕生成及語音筆記等場景,且對不同口音與背景噪音具有較高的辨識準確度。 不過,Whisper本身並非一個可直接使用的應用程式,而是一項需要透過其他軟體或程式整合使用的技術,較適合開發者或有相關需求的人進行應用。
03-22
M11433003 : Whisper 是由 OpenAI 開發的 AI 語音辨識工具,主要功能如下: 聽打逐字稿:將錄音或影片內容精準轉成文字。 自動翻譯:能將各國語音(如日文、法文)直接翻譯成英文文字。 多國語言支援:包含中文、英文等 90 多種語言,且對口音與雜音的容錯率很高。 免費開源:它是開放原始碼的,許多第三方軟體(如字幕工具)都內建這項技術。 你可以把它想像成一個「AI 聽寫員」,專門幫人省去人工打字的時間。
03-20
c11333119 : Whisper 是由 OpenAI 開發的語音辨識軟體,主要功能是將語音自動轉換為文字。它支援多種語言,並能進行語音翻譯,例如將英文語音轉成中文文字。
安文
whisper是什麼軟體
03-20 1 樓
顯示先前的回應8 則當中的 3 則
M11433002
能將錄音檔、影片中的語音精準地轉成文字,並支持多國語言翻譯
 
03-20 2 樓
B11115009
簡單來說,Whisper 是由 OpenAI研發的一款開源自動語音辨識(Automatic Speech Recognition, ASR)模型。

它不像一般的 App 下載後就有個漂亮的介面,它更像是一顆強大的「大腦」,開發者可以把它安裝在各種軟體或系統中,用來處理語音轉文字。
03-20 3 樓
M11433011
Whisper 是由 OpenAI 開發的語音辨識軟體,主要功能是將語音自動轉換為文字。它支援多種語言,並能進行語音翻譯,例如將英文語音轉成中文文字。Whisper 對不同口音及背景雜音具有良好的辨識能力,因此常被應用於會議紀錄、課堂筆記整理、影片字幕生成等情境。透過此工具,使用者可以更快速且有效率地將語音內容轉為文字資料。
03-20 4 樓
c11333119
Whisper 是由 OpenAI 開發的語音辨識軟體,主要功能是將語音自動轉換為文字。它支援多種語言,並能進行語音翻譯,例如將英文語音轉成中文文字。
03-20 5 樓
M11433003
Whisper 是由 OpenAI 開發的 AI 語音辨識工具,主要功能如下:
聽打逐字稿:將錄音或影片內容精準轉成文字。
自動翻譯:能將各國語音(如日文、法文)直接翻譯成英文文字。
多國語言支援:包含中文、英文等 90 多種語言,且對口音與雜音的容錯率很高。
免費開源:它是開放原始碼的,許多第三方軟體(如字幕工具)都內建這項技術。
你可以把它想像成一個「AI 聽寫員」,專門幫人省去人工打字的時間。
03-22 6 樓
武氏金英
Whisper 是由 OpenAI 開發的語音辨識AI模型,主要功能是將語音轉換為文字,並支援多語言辨識與翻譯。它能應用於會議錄音整理、影片字幕生成及語音筆記等場景,且對不同口音與背景噪音具有較高的辨識準確度。
不過,Whisper本身並非一個可直接使用的應用程式,而是一項需要透過其他軟體或程式整合使用的技術,較適合開發者或有相關需求的人進行應用。
03-24 7 樓
鄧萱琳
Whisper 是由 OpenAI 開發的一款開源自動語音辨識(ASR)系統。簡單來說,它是一位聽力極佳且精通多國語言的數位速記員。它能將音檔或影片中的對話精準地轉譯成文字(逐字稿),甚至直接進行翻譯。比起傳統的辨識軟體,Whisper 最厲害的地方在於它對背景雜音、不同口音以及專有名詞的處理能力極強,是目前學術研究與影音創作領域中,公認最強大的語音轉文字工具之一。
03-24 8 樓
m11433004
Whisper 是由 OpenAI 開發的一款自動語音辨識(ASR)模型。它主要的功能是將「語音轉成文字」,並具備翻譯功能。
04-09 9 樓
筆記功能僅開放給課程成員,請先加入課程
原始資料來自: https://eclass.uch.edu.tw/media/40297
Prev
NLP的應用whisper
Next
免費版Openai-whisper超好用---簡介