登入
首頁
收藏
0
返回課程
AI 影像辨識黑科技:YOLO-World 實測,連黑柴與戰車都能精準偵測?
生成式AI研討
LLM簡介與使用
加入課程請說出對課程的期許
分組
分組
使用Google生成式AI Gemini 詢問程式語言排名 tiobe與IEEE spectrum
chatGPT與big data
試用xAI Grok與產生短片
LLM?
imitationGame
LLM簡介之一
LLM簡介之二
NLP
自然語言處理 Natural language Processing簡介
自然語言處理 Natural language Processing 字詞量化
NLP pptx
展示詞嵌入Word Embeddings& TTS.ipynb
恐怖谷,不気味の谷現象,Uncanny Valley
Natural language Processing、字詞向量與 TTS之一
Natural language Processing、字詞向量與 TTS之二
NLP的應用whisper
openai whisper在huggingface的試用與在colab上的使用
免費版Openai-whisper超好用---簡介
whisper turbo版與large v2版colab GPU語音辨識練習
whisper large v3 python轉VTT字幕
openai_whisper_ex0.ipynb
Ex1
神經網路與mnist, emnist
Keras實作神經網路模型之1 mnist手寫數字
AI機器學習Keras淺層神經網路辨識mnist手寫數字
Keras實作神經網路模型
神經網路模型之一 從感知器到神經網路
神經網路模型.ipynb
神經網路模型_emnist.ipynb
手寫字母數字emnist之神經網路辨識實作
CNN與手寫數字、字母
CNN卷積計算辨識mnist手寫數字
實作CNN模型辨識mnist.ipynb
CNN網路模型_emnist.ipynb
CNN卷積神經網路的視覺化解構
[用AI學AI]CNN辨識手寫字母EMNIST
生成式AI RAG應用
RAG之NotebookLM操作與Keras辨識mnist手寫數字程式
深度學習的 「Hello World」 辨識mnist手寫數字NotebookLM之Podcast
期中報告
期中作業
第一組 期中影片
第二組 |第3_4_5課影片縂整理(M11432009-M11432901期中作業)
第三組影片
生成式AI研討—M11433011
歡迎來到實用_AI:教導機器感知_M11433002_簡日昌
YOLO
YOLO26x AI 眼中的牠是貓?黑柴表示:我太難了
YOLO26在Colab Python上試做之1
YOLO26在Colab Python上試做畫面分割、姿態檢測與隨機狗辨識
YOLO code
YOLO-world
為什麼黑柴和魯夫會變綠?帶你解析 YOLO-seg 的神奇分割技術與趣味翻車現場
黑柴心很累 擋路的是虎式坦克,AI 竟然不認識?
告別誤判為貓?YOLO-World 實測:黑柴成功認出,但戰車卻徹底翻車?
AI 影像辨識黑科技:YOLO-World 實測,連黑柴與戰車都能精準偵測?
YOLO好用2.ipynb
安裝YOLO相關軟體與辨識影片用VideoWriter燒錄
期末報告
期末
open claw簡介與AI代理
生成式ai的多元應用-第三組
重點
討論
(1)
筆記
發表時間 : 2026-05-15 10:11
觀看次數 : 26
原始資料來自 :
https://www.youtube.com/embed/9g-VR9UnJjs?si=UD0DFOr__bDitchR
附件
討論功能僅開放給課程成員,請先加入課程
最新的回應
...more
05-22
M11433002
:
傳統 YOLO(封閉式): AI 就像一個死背書學生。如果你在訓練它時,只教它看過「貓、狗、汽車」這 3 種東西,那它在實際運作時就只能辨識這 3 種東西。如果你突然叫它找一隻「長頸鹿」或一個「星巴克馬克杯」,它是完全看不出來的。如果想加新東西,工程師就必須重新收集成千上萬張照片,重新訓練模型(耗時又耗錢)。 YOLO-World(開放式): 它結合了「影像辨識」與「語言理解(LLM)」。你不需要提前訓練它認識特定物品,只要在執行時直接「輸入文字(Prompt)」,它就能現學現賣,立刻在畫面上幫你找出來。
05-19
c11333119
:
YOLO-World 是一種基於熱門物件偵測框架 YOLOv8 的先進「開放詞彙(Open-Vocabulary)」即時目標檢測模型。它打破了傳統 AI 只能辨識特定類別的限制,讓您輸入任意文字提示(Prompt)或描述,就能讓 AI 找出圖像中相對應的物
05-15
鄧萱琳
:
YOLO-World 是電腦視覺領域中一個突破性的進展,它將傳統的 YOLO (You Only Look Once) 系列推向了「開放詞彙 (Open-Vocabulary)」的新境界。 簡單來說,傳統的物件偵測模型(如 YOLOv8 或 YOLOv10)就像一個只認識固定單字的學生(例如只認識「人、車、狗」這 80 類),而 YOLO-World 則像是一個讀過字典的學生,你可以用自然語言隨時叫它去找任何東西。
05-15
M11433011
:
YOLO-World 是一種結合 YOLO 即時物件偵測與 Vision-Language AI 的模型,特色是支援「開放詞彙(Open-Vocabulary)」偵測。與傳統 YOLO 只能辨識固定類別不同,YOLO-World 可以直接透過文字描述來搜尋物件,例如輸入「helmet」或「red backpack」,模型就能在影像中找到對應目標並標示位置。 它的核心技術是把文字與影像轉換到同一個語意空間,讓模型能理解文字與畫面之間的關聯,因此具備 Zero-shot Detection 能力,也就是即使沒有專門訓練過某個物件,仍可能成功辨識。YOLO-World 同時保留 YOLO 系列高速、適合即時應用的優勢,常見於智慧監控、機器人、自駕車與智慧工廠等 AI 視覺場景。
05-15
M11433003
:
YOLO-World 是一種「開放詞彙」即時物件偵測模型。 它結合: YOLO 的高速物件偵測 文字理解能力(Vision-Language) 因此不需要重新訓練,就能透過文字直接偵測新物件。 YOLO-World = 能靠文字指令即時找物件的 YOLO。
安文
說明一下YOLO-world
05-15
1 樓
顯示先前的回應
6 則當中的 3 則
武氏金英
YOLO-World 是一種基於 Ultralytics YOLOv8 框架的先進、即時(Real-time)開放詞彙(Open-Vocabulary)目標檢測模型。與傳統的 YOLO 模型只能識別訓練集中的預定義類別不同,YOLO-World 能夠根據使用者的文字描述(Prompt)來識別圖像或影片中的物件。
05-15
2 樓
M11433003
YOLO-World 是一種「開放詞彙」即時物件偵測模型。
它結合:
YOLO 的高速物件偵測
文字理解能力(Vision-Language)
因此不需要重新訓練,就能透過文字直接偵測新物件。
YOLO-World = 能靠文字指令即時找物件的 YOLO。
05-15
3 樓
M11433011
YOLO-World 是一種結合 YOLO 即時物件偵測與 Vision-Language AI 的模型,特色是支援「開放詞彙(Open-Vocabulary)」偵測。與傳統 YOLO 只能辨識固定類別不同,YOLO-World 可以直接透過文字描述來搜尋物件,例如輸入「helmet」或「red backpack」,模型就能在影像中找到對應目標並標示位置。
它的核心技術是把文字與影像轉換到同一個語意空間,讓模型能理解文字與畫面之間的關聯,因此具備 Zero-shot Detection 能力,也就是即使沒有專門訓練過某個物件,仍可能成功辨識。YOLO-World 同時保留 YOLO 系列高速、適合即時應用的優勢,常見於智慧監控、機器人、自駕車與智慧工廠等 AI 視覺場景。
05-15
4 樓
鄧萱琳
YOLO-World 是電腦視覺領域中一個突破性的進展,它將傳統的 YOLO (You Only Look Once) 系列推向了「開放詞彙 (Open-Vocabulary)」的新境界。
簡單來說,傳統的物件偵測模型(如 YOLOv8 或 YOLOv10)就像一個只認識固定單字的學生(例如只認識「人、車、狗」這 80 類),而 YOLO-World 則像是一個讀過字典的學生,你可以用自然語言隨時叫它去找任何東西。
05-15
5 樓
c11333119
YOLO-World 是一種基於熱門物件偵測框架 YOLOv8 的先進「開放詞彙(Open-Vocabulary)」即時目標檢測模型。它打破了傳統 AI 只能辨識特定類別的限制,讓您輸入任意文字提示(Prompt)或描述,就能讓 AI 找出圖像中相對應的物
05-19
6 樓
M11433002
傳統 YOLO(封閉式):
AI 就像一個死背書學生。如果你在訓練它時,只教它看過「貓、狗、汽車」這 3 種東西,那它在實際運作時就只能辨識這 3 種東西。如果你突然叫它找一隻「長頸鹿」或一個「星巴克馬克杯」,它是完全看不出來的。如果想加新東西,工程師就必須重新收集成千上萬張照片,重新訓練模型(耗時又耗錢)。
YOLO-World(開放式):
它結合了「影像辨識」與「語言理解(LLM)」。你不需要提前訓練它認識特定物品,只要在執行時直接「輸入文字(Prompt)」,它就能現學現賣,立刻在畫面上幫你找出來。
05-22
7 樓
筆記功能僅開放給課程成員,請先加入課程
Prev
告別誤判為貓?YOLO-World 實測:黑柴成功認出,但戰車卻徹底翻車?
Next
YOLO好用2.ipynb
AI 就像一個死背書學生。如果你在訓練它時,只教它看過「貓、狗、汽車」這 3 種東西,那它在實際運作時就只能辨識這 3 種東西。如果你突然叫它找一隻「長頸鹿」或一個「星巴克馬克杯」,它是完全看不出來的。如果想加新東西,工程師就必須重新收集成千上萬張照片,重新訓練模型(耗時又耗錢)。
YOLO-World(開放式):
它結合了「影像辨識」與「語言理解(LLM)」。你不需要提前訓練它認識特定物品,只要在執行時直接「輸入文字(Prompt)」,它就能現學現賣,立刻在畫面上幫你找出來。