安文
說明一下YOLO-world
05-15 1 樓
顯示先前的回應6 則當中的 3 則
鄧萱琳
YOLO-World 是電腦視覺領域中一個突破性的進展,它將傳統的 YOLO (You Only Look Once) 系列推向了「開放詞彙 (Open-Vocabulary)」的新境界。
簡單來說,傳統的物件偵測模型(如 YOLOv8 或 YOLOv10)就像一個只認識固定單字的學生(例如只認識「人、車、狗」這 80 類),而 YOLO-World 則像是一個讀過字典的學生,你可以用自然語言隨時叫它去找任何東西。
05-15 5 樓
c11333119
YOLO-World 是一種基於熱門物件偵測框架 YOLOv8 的先進「開放詞彙(Open-Vocabulary)」即時目標檢測模型。它打破了傳統 AI 只能辨識特定類別的限制,讓您輸入任意文字提示(Prompt)或描述,就能讓 AI 找出圖像中相對應的物
05-19 6 樓
M11433002
傳統 YOLO(封閉式):
AI 就像一個死背書學生。如果你在訓練它時,只教它看過「貓、狗、汽車」這 3 種東西,那它在實際運作時就只能辨識這 3 種東西。如果你突然叫它找一隻「長頸鹿」或一個「星巴克馬克杯」,它是完全看不出來的。如果想加新東西,工程師就必須重新收集成千上萬張照片,重新訓練模型(耗時又耗錢)。

YOLO-World(開放式):
它結合了「影像辨識」與「語言理解(LLM)」。你不需要提前訓練它認識特定物品,只要在執行時直接「輸入文字(Prompt)」,它就能現學現賣,立刻在畫面上幫你找出來。
05-22 7 樓