登入首頁
收藏 0
返回課程
AI 影像辨識黑科技:YOLO-World 實測,連黑柴與戰車都能精準偵測?
  • 生成式AI研討
  • LLM簡介與使用
  • 加入課程請說出對課程的期許
  • 分組
  • 分組
  • 使用Google生成式AI Gemini 詢問程式語言排名 tiobe與IEEE spectrum
  • chatGPT與big data
  • 試用xAI Grok與產生短片
  • LLM?
  • imitationGame
  • LLM簡介之一
  • LLM簡介之二
  • NLP
  • 自然語言處理 Natural language Processing簡介
  • 自然語言處理 Natural language Processing 字詞量化
  • NLP pptx
  • 展示詞嵌入Word Embeddings& TTS.ipynb
  • 恐怖谷,不気味の谷現象,Uncanny Valley
  • Natural language Processing、字詞向量與 TTS之一
  • Natural language Processing、字詞向量與 TTS之二
  • NLP的應用whisper
  • openai whisper在huggingface的試用與在colab上的使用
  • 免費版Openai-whisper超好用---簡介
  • whisper turbo版與large v2版colab GPU語音辨識練習
  • whisper large v3 python轉VTT字幕
  • openai_whisper_ex0.ipynb
  • Ex1
  • 神經網路與mnist, emnist
  • Keras實作神經網路模型之1 mnist手寫數字
  • AI機器學習Keras淺層神經網路辨識mnist手寫數字
  • Keras實作神經網路模型
  • 神經網路模型之一 從感知器到神經網路
  • 神經網路模型.ipynb
  • 神經網路模型_emnist.ipynb
  • 手寫字母數字emnist之神經網路辨識實作
  • CNN與手寫數字、字母
  • CNN卷積計算辨識mnist手寫數字
  • 實作CNN模型辨識mnist.ipynb
  • CNN網路模型_emnist.ipynb
  • CNN卷積神經網路的視覺化解構
  • [用AI學AI]CNN辨識手寫字母EMNIST
  • 生成式AI RAG應用
  • RAG之NotebookLM操作與Keras辨識mnist手寫數字程式
  • 深度學習的 「Hello World」 辨識mnist手寫數字NotebookLM之Podcast
  • 期中報告
  • 期中作業
  • 第一組 期中影片
  • 第二組 |第3_4_5課影片縂整理(M11432009-M11432901期中作業)
  • 第三組影片
  • 生成式AI研討—M11433011
  • 歡迎來到實用_AI:教導機器感知_M11433002_簡日昌
  • YOLO
  • YOLO26x AI 眼中的牠是貓?黑柴表示:我太難了
  • YOLO26在Colab Python上試做之1
  • YOLO26在Colab Python上試做畫面分割、姿態檢測與隨機狗辨識
  • YOLO code
  • YOLO-world
  • 為什麼黑柴和魯夫會變綠?帶你解析 YOLO-seg 的神奇分割技術與趣味翻車現場
  • 黑柴心很累 擋路的是虎式坦克,AI 竟然不認識?
  • 告別誤判為貓?YOLO-World 實測:黑柴成功認出,但戰車卻徹底翻車?
  • AI 影像辨識黑科技:YOLO-World 實測,連黑柴與戰車都能精準偵測?
  • YOLO好用2.ipynb
  • 安裝YOLO相關軟體與辨識影片用VideoWriter燒錄
  • 期末報告
  • 期末
  • open claw簡介與AI代理
  • 生成式ai的多元應用-第三組
  • 重點
  • 討論 (1)
  • 筆記
發表時間 : 2026-05-15 10:11
觀看次數 : 26
原始資料來自 : https://www.youtube.com/embed/9g-VR9UnJjs?si=UD0DFOr__bDitchR
附件
討論功能僅開放給課程成員,請先加入課程
最新的回應 ...more
05-22
M11433002 : 傳統 YOLO(封閉式): AI 就像一個死背書學生。如果你在訓練它時,只教它看過「貓、狗、汽車」這 3 種東西,那它在實際運作時就只能辨識這 3 種東西。如果你突然叫它找一隻「長頸鹿」或一個「星巴克馬克杯」,它是完全看不出來的。如果想加新東西,工程師就必須重新收集成千上萬張照片,重新訓練模型(耗時又耗錢)。 YOLO-World(開放式): 它結合了「影像辨識」與「語言理解(LLM)」。你不需要提前訓練它認識特定物品,只要在執行時直接「輸入文字(Prompt)」,它就能現學現賣,立刻在畫面上幫你找出來。
05-19
c11333119 : YOLO-World 是一種基於熱門物件偵測框架 YOLOv8 的先進「開放詞彙(Open-Vocabulary)」即時目標檢測模型。它打破了傳統 AI 只能辨識特定類別的限制,讓您輸入任意文字提示(Prompt)或描述,就能讓 AI 找出圖像中相對應的物
05-15
鄧萱琳 : YOLO-World 是電腦視覺領域中一個突破性的進展,它將傳統的 YOLO (You Only Look Once) 系列推向了「開放詞彙 (Open-Vocabulary)」的新境界。 簡單來說,傳統的物件偵測模型(如 YOLOv8 或 YOLOv10)就像一個只認識固定單字的學生(例如只認識「人、車、狗」這 80 類),而 YOLO-World 則像是一個讀過字典的學生,你可以用自然語言隨時叫它去找任何東西。
05-15
M11433011 : YOLO-World 是一種結合 YOLO 即時物件偵測與 Vision-Language AI 的模型,特色是支援「開放詞彙(Open-Vocabulary)」偵測。與傳統 YOLO 只能辨識固定類別不同,YOLO-World 可以直接透過文字描述來搜尋物件,例如輸入「helmet」或「red backpack」,模型就能在影像中找到對應目標並標示位置。 它的核心技術是把文字與影像轉換到同一個語意空間,讓模型能理解文字與畫面之間的關聯,因此具備 Zero-shot Detection 能力,也就是即使沒有專門訓練過某個物件,仍可能成功辨識。YOLO-World 同時保留 YOLO 系列高速、適合即時應用的優勢,常見於智慧監控、機器人、自駕車與智慧工廠等 AI 視覺場景。
05-15
M11433003 : YOLO-World 是一種「開放詞彙」即時物件偵測模型。 它結合: YOLO 的高速物件偵測 文字理解能力(Vision-Language) 因此不需要重新訓練,就能透過文字直接偵測新物件。 YOLO-World = 能靠文字指令即時找物件的 YOLO。
安文
說明一下YOLO-world
05-15 1 樓
顯示先前的回應6 則當中的 3 則
武氏金英
YOLO-World 是一種基於 Ultralytics YOLOv8 框架的先進、即時(Real-time)開放詞彙(Open-Vocabulary)目標檢測模型。與傳統的 YOLO 模型只能識別訓練集中的預定義類別不同,YOLO-World 能夠根據使用者的文字描述(Prompt)來識別圖像或影片中的物件。
05-15 2 樓
M11433003
YOLO-World 是一種「開放詞彙」即時物件偵測模型。

它結合:

YOLO 的高速物件偵測
文字理解能力(Vision-Language)

因此不需要重新訓練,就能透過文字直接偵測新物件。

YOLO-World = 能靠文字指令即時找物件的 YOLO。
05-15 3 樓
M11433011
YOLO-World 是一種結合 YOLO 即時物件偵測與 Vision-Language AI 的模型,特色是支援「開放詞彙(Open-Vocabulary)」偵測。與傳統 YOLO 只能辨識固定類別不同,YOLO-World 可以直接透過文字描述來搜尋物件,例如輸入「helmet」或「red backpack」,模型就能在影像中找到對應目標並標示位置。
它的核心技術是把文字與影像轉換到同一個語意空間,讓模型能理解文字與畫面之間的關聯,因此具備 Zero-shot Detection 能力,也就是即使沒有專門訓練過某個物件,仍可能成功辨識。YOLO-World 同時保留 YOLO 系列高速、適合即時應用的優勢,常見於智慧監控、機器人、自駕車與智慧工廠等 AI 視覺場景。
05-15 4 樓
鄧萱琳
YOLO-World 是電腦視覺領域中一個突破性的進展,它將傳統的 YOLO (You Only Look Once) 系列推向了「開放詞彙 (Open-Vocabulary)」的新境界。
簡單來說,傳統的物件偵測模型(如 YOLOv8 或 YOLOv10)就像一個只認識固定單字的學生(例如只認識「人、車、狗」這 80 類),而 YOLO-World 則像是一個讀過字典的學生,你可以用自然語言隨時叫它去找任何東西。
05-15 5 樓
c11333119
YOLO-World 是一種基於熱門物件偵測框架 YOLOv8 的先進「開放詞彙(Open-Vocabulary)」即時目標檢測模型。它打破了傳統 AI 只能辨識特定類別的限制,讓您輸入任意文字提示(Prompt)或描述,就能讓 AI 找出圖像中相對應的物
05-19 6 樓
M11433002
傳統 YOLO(封閉式):
AI 就像一個死背書學生。如果你在訓練它時,只教它看過「貓、狗、汽車」這 3 種東西,那它在實際運作時就只能辨識這 3 種東西。如果你突然叫它找一隻「長頸鹿」或一個「星巴克馬克杯」,它是完全看不出來的。如果想加新東西,工程師就必須重新收集成千上萬張照片,重新訓練模型(耗時又耗錢)。

YOLO-World(開放式):
它結合了「影像辨識」與「語言理解(LLM)」。你不需要提前訓練它認識特定物品,只要在執行時直接「輸入文字(Prompt)」,它就能現學現賣,立刻在畫面上幫你找出來。
05-22 7 樓
筆記功能僅開放給課程成員,請先加入課程
Prev
告別誤判為貓?YOLO-World 實測:黑柴成功認出,但戰車卻徹底翻車?
Next
YOLO好用2.ipynb