多模態的最新熱門文章

新聞

OpenAI 推出 4o Image Generation 圖像生成功能，AI 繪圖更精準、擬真、未來免費用戶也能用

janus 發表於 2025年3月26日 08:00

4o Image Generation 的多種應用情境，從模擬白板會議記錄、生成富含意義的文字圖像、創作趣味漫畫，乃至複雜的科學實驗圖解，GPT-4o 皆能輕鬆應對，展現其強大的多模態能力。

新聞

洪詩詩發表於 2025年3月11日 16:00

Google 近期推送 Pixel 更新，主要更新包含 Gemini Live 互動方式、Pixel Watch 也加入更多健康相關功能。

新聞

netizen 發表於 2024年10月03日 09:00

Nvidia 丟下震撼彈：全新 AI 模型開源、規模龐大，準備好與 GPT-4 匹敵

新聞

cnBeta 發表於 2024年9月26日 11:12

Llama 3.2：視覺模型趕超GPT-4o mini，1B端側模型媲美Gemma

新聞

bigdatadigest 發表於 2024年9月17日 13:00

AI 專家卡帕斯認為「大型語言模型」（LLM）名稱不準確，應改為更通用的「自回歸序列轉換模型」。此觀點引發廣泛討論。

新聞

netizen 發表於 2024年9月01日 09:00

中國電子商務巨頭阿里巴巴的雲端服務和儲存部門阿里雲宣布推出其最新先進的視覺語言模型 Qwen2-VL，旨在增強視覺理解、影片理解和多語言文本圖像處理。