登入首頁
收藏 0
返回課程
自然語言處理 Natural language Processing 字詞量化
  • 生成式AI研討
  • LLM簡介與使用
  • 加入課程請說出對課程的期許
  • 分組
  • 分組
  • 使用Google生成式AI Gemini 詢問程式語言排名 tiobe與IEEE spectrum
  • chatGPT與big data
  • 試用xAI Grok與產生短片
  • LLM?
  • imitationGame
  • LLM簡介之一
  • LLM簡介之二
  • NLP
  • 自然語言處理 Natural language Processing簡介
  • 自然語言處理 Natural language Processing 字詞量化
  • NLP pptx
  • 展示詞嵌入Word Embeddings& TTS.ipynb
  • 恐怖谷,不気味の谷現象,Uncanny Valley
  • Natural language Processing、字詞向量與 TTS之一
  • Natural language Processing、字詞向量與 TTS之二
  • NLP的應用whisper
  • openai whisper在huggingface的試用與在colab上的使用
  • 免費版Openai-whisper超好用---簡介
  • whisper turbo版與large v2版colab GPU語音辨識練習
  • whisper large v3 python轉VTT字幕
  • openai_whisper_ex0.ipynb
  • Ex1
  • 神經網路與mnist, emnist
  • Keras實作神經網路模型之1 mnist手寫數字
  • AI機器學習Keras淺層神經網路辨識mnist手寫數字
  • Keras實作神經網路模型
  • 神經網路模型之一 從感知器到神經網路
  • 神經網路模型.ipynb
  • 神經網路模型_emnist.ipynb
  • 手寫字母數字emnist之神經網路辨識實作
  • CNN與手寫數字、字母
  • CNN卷積計算辨識mnist手寫數字
  • 實作CNN模型辨識mnist.ipynb
  • CNN網路模型_emnist.ipynb
  • CNN卷積神經網路的視覺化解構
  • [用AI學AI]CNN辨識手寫字母EMNIST
  • 生成式AI RAG應用
  • RAG之NotebookLM操作與Keras辨識mnist手寫數字程式
  • 深度學習的 「Hello World」 辨識mnist手寫數字NotebookLM之Podcast
  • 期中報告
  • 期中作業
  • 第一組 期中影片
  • 第二組 |第3_4_5課影片縂整理(M11432009-M11432901期中作業)
  • 第三組影片
  • 生成式AI研討—M11433011
  • 歡迎來到實用_AI:教導機器感知_M11433002_簡日昌
  • YOLO
  • YOLO26x AI 眼中的牠是貓?黑柴表示:我太難了
  • YOLO26在Colab Python上試做之1
  • YOLO26在Colab Python上試做畫面分割、姿態檢測與隨機狗辨識
  • YOLO code
  • YOLO-world
  • 為什麼黑柴和魯夫會變綠?帶你解析 YOLO-seg 的神奇分割技術與趣味翻車現場
  • 黑柴心很累 擋路的是虎式坦克,AI 竟然不認識?
  • 告別誤判為貓?YOLO-World 實測:黑柴成功認出,但戰車卻徹底翻車?
  • AI 影像辨識黑科技:YOLO-World 實測,連黑柴與戰車都能精準偵測?
  • YOLO好用2.ipynb
  • 安裝YOLO相關軟體與辨識影片用VideoWriter燒錄
  • 期末報告
  • 期末
  • open claw簡介與AI代理
  • 生成式ai的多元應用-第三組
  • 重點
  • 討論 (1)
  • 共享筆記 (2)
  • 筆記
發表時間 : 2026-03-13 10:44
觀看次數 : 36
原始資料來自 : https://www.youtube.com/embed/ewLiGWzvsrE?si=oEbvEzmrQ76Zxa-N
附件
討論功能僅開放給課程成員,請先加入課程
最新的回應 ...more
04-09
m11433004 : 在人工智慧與自然語言處理(NLP)領域,將「字詞量化」的過程稱為向量化(Vectorization)。因為電腦只理解數字,無法直接處理文字,所以我們必須將文字轉換成數值向量。
03-20
M11433011 : 字詞量化是透過自然語言處理技術,將具有語意的文字轉換為電腦能處理的數值向量,使原本抽象的詞彙能以數學方式表示。常見方法如 TF-IDF,依據詞語出現頻率衡量其重要性;或透過詞嵌入,根據上下文關係將詞映射到多維向量空間中。如此一來,不僅能定位詞語位置,也能進一步計算詞與詞之間的相似度與語意關聯,提升模型對語言的理解與應用能力。
03-18
c11333119 : 在電腦的世界裡,所有的資訊最終都要變成數字。要把人類的文字轉化為電腦的數據,這個過程我們稱為文字向量化
03-13
鄧萱琳 : 字詞量化是透過自然語言處理技術,將具備語義的文字轉換為電腦可運算的數值向量,讓原本模糊的詞彙能根據出現頻率(如 TF-IDF)或上下文關聯性(如 Word Embedding)在多維座標空間中定位,進而計算詞與詞之間的相似度與邏輯關係。
03-13
M11433003 : 透過閱讀大量文本資料,AI 會學到一個規律:「經常一起出現的詞,通常在語意上也比較接近。」因此,電腦會把像「狗」這樣的詞轉換成一串數字,例如 [0.21, -0.45, 0.88, ...],這可能是一個包含 300 個數值的向量。 神奇的地方在於: 當每個詞都被表示為空間中的座標後,文字就能用數學方式來處理與分析。 距離代表語意接近程度: 在這個多維度空間裡,「蘋果」與「橘子」的位置會非常靠近,而它們與「汽車」之間的距離則會相對遙遠,因為語意差異較大。 語意也能做加減運算: 一個經典例子是: 向量(國王) − 向量(男人) + 向量(女人) ≈ 向量(女王)。 透過簡單的數學運算,電腦竟然能推導出性別與角色之間的關係。 在本機運行 AI 模型時: 這種稱為「詞嵌入」(Word Embedding)的技術是核心基礎。當你輸入提示詞時,模型會先把文字切分成小單位,轉換成高維度向量,接著在龐大的神經網路矩陣中進行運算,最後再把計算得到的向量轉換回人類可以理解的文字。
安文
字詞要如何量化?
03-13 1 樓
顯示先前的回應9 則當中的 3 則
M11433002
字詞量化就是把文字轉換成一串數字(座標),讓電腦能像算數學一樣,計算出詞與詞之間的語意距離,影片中是透過程式來將相關字詞量化。
03-13 2 樓
B11115009
在電腦的世界裡,所有的資訊最終都要變成數字。要把人類感性的文字轉化為電腦感性的數據,這個過程我們稱為文字表示法或向量化
03-13 3 樓
c11333119
科學家發現,與其只算字數,不如把每一個詞都轉換成一個「高維度的座標空間」。

作法: 透過閱讀海量的文本,AI 會學習到「常一起出現的詞,意思通常相近」。例如,電腦會把「狗」轉換成類似 [0.21, -0.45, 0.88, ...] 這樣由 300 個數字組成的向量。

奇妙的化學反應: 當字詞變成空間中的座標點後,我們就可以對文字做數學運算!

距離代表相似度: 在這個多維空間裡,「蘋果」和「橘子」的座標距離會非常近,而它們離「汽車」的距離會非常遠。

語意加減法: 最經典的例子是:向量(國王) - 向量(男人) + 向量(女人) ≈ 向量(女王)。電腦透過數字的加減,竟然推導出了性別與階級的關係。

當你在設定和執行本機 AI 模型時,這些語言模型底層正是極度依賴這種「詞嵌入」的向量化過程。模型會將你輸入的提示詞切塊、轉換成這些高維度向量,並在巨大的神經網路矩陣中進行計算,最後再將算出來的向量結果轉換回我們看得懂的文字。
03-13 4 樓
武氏金英
字詞量化是指把原本無法直接計算的文字,轉換成可以用數字表示的形式,讓電腦能進行分析與運算;常見方法包括用詞出現次數表示的 詞袋模型、考慮詞在文件重要性的 TF-IDF,以及利用神經網路學習語意向量的 Word2Vec 等。
03-13 5 樓
M11433003
透過閱讀大量文本資料,AI 會學到一個規律:「經常一起出現的詞,通常在語意上也比較接近。」因此,電腦會把像「狗」這樣的詞轉換成一串數字,例如 [0.21, -0.45, 0.88, ...],這可能是一個包含 300 個數值的向量。

神奇的地方在於:
當每個詞都被表示為空間中的座標後,文字就能用數學方式來處理與分析。

距離代表語意接近程度:
在這個多維度空間裡,「蘋果」與「橘子」的位置會非常靠近,而它們與「汽車」之間的距離則會相對遙遠,因為語意差異較大。

語意也能做加減運算:
一個經典例子是:
向量(國王) − 向量(男人) + 向量(女人) ≈ 向量(女王)。
透過簡單的數學運算,電腦竟然能推導出性別與角色之間的關係。

在本機運行 AI 模型時:
這種稱為「詞嵌入」(Word Embedding)的技術是核心基礎。當你輸入提示詞時,模型會先把文字切分成小單位,轉換成高維度向量,接著在龐大的神經網路矩陣中進行運算,最後再把計算得到的向量轉換回人類可以理解的文字。
03-13 6 樓
鄧萱琳
字詞量化是透過自然語言處理技術,將具備語義的文字轉換為電腦可運算的數值向量,讓原本模糊的詞彙能根據出現頻率(如 TF-IDF)或上下文關聯性(如 Word Embedding)在多維座標空間中定位,進而計算詞與詞之間的相似度與邏輯關係。
03-13 7 樓
c11333119
在電腦的世界裡,所有的資訊最終都要變成數字。要把人類的文字轉化為電腦的數據,這個過程我們稱為文字向量化
03-18 8 樓
M11433011
字詞量化是透過自然語言處理技術,將具有語意的文字轉換為電腦能處理的數值向量,使原本抽象的詞彙能以數學方式表示。常見方法如 TF-IDF,依據詞語出現頻率衡量其重要性;或透過詞嵌入,根據上下文關係將詞映射到多維向量空間中。如此一來,不僅能定位詞語位置,也能進一步計算詞與詞之間的相似度與語意關聯,提升模型對語言的理解與應用能力。
03-20 9 樓
m11433004
在人工智慧與自然語言處理(NLP)領域,將「字詞量化」的過程稱為向量化(Vectorization)。因為電腦只理解數字,無法直接處理文字,所以我們必須將文字轉換成數值向量。
04-09 10 樓
筆記功能僅開放給課程成員,請先加入課程
Prev
自然語言處理 Natural language Processing簡介
Next
NLP pptx