首頁 多模態 多模態 的最新熱門文章 新聞 OpenAI 推出 4o Image Generation 圖像生成功能,AI 繪圖更精準、擬真、未來免費用戶也能用 janus 發表於 2025年3月26日 08:00 Plurk 4o Image Generation 的多種應用情境,從模擬白板會議記錄、生成富含意義的文字圖像、創作趣味漫畫,乃至複雜的科學實驗圖解,GPT-4o 皆能輕鬆應對,展現其強大的多模態能力。 新聞 Pixel 三月功能更新:Gemini Live 操作更容易、Pixel Watch 加入更多健康功能 洪詩詩 發表於 2025年3月11日 16:00 Plurk Google 近期推送 Pixel 更新,主要更新包含 Gemini Live 互動方式、Pixel Watch 也加入更多健康相關功能。 新聞 超越 GPT-4?Nvidia 開源 720 億參數 AI 模型 NVLM-D-72B,圖像理解、文字能力全面升級! netizen 發表於 2024年10月03日 09:00 Plurk Nvidia 丟下震撼彈:全新 AI 模型開源、規模龐大,準備好與 GPT-4 匹敵 新聞 Meta發佈最強開源AI模型 Llama 3.2:視覺模型趕超GPT-4o mini,還有可單獨安裝在手機上的版本 cnBeta 發表於 2024年9月26日 11:12 Plurk Llama 3.2:視覺模型趕超GPT-4o mini,1B端側模型媲美Gemma 新聞 「大型語言模型」名不符實?專家籲正名,馬斯克也參戰! bigdatadigest 發表於 2024年9月17日 13:00 Plurk AI 專家卡帕斯認為「大型語言模型」(LLM)名稱不準確,應改為更通用的「自回歸序列轉換模型」。此觀點引發廣泛討論。 新聞 阿里雲推出全新視覺語言模型Qwen2-VL,可分析超過 20 分鐘長的影片,實現AI「類人視覺感知」 netizen 發表於 2024年9月01日 09:00 Plurk 中國電子商務巨頭阿里巴巴的雲端服務和儲存部門阿里雲宣布推出其最新先進的視覺語言模型 Qwen2-VL,旨在增強視覺理解、影片理解和多語言文本圖像處理。 上一頁1下一頁
新聞 OpenAI 推出 4o Image Generation 圖像生成功能,AI 繪圖更精準、擬真、未來免費用戶也能用 janus 發表於 2025年3月26日 08:00 Plurk 4o Image Generation 的多種應用情境,從模擬白板會議記錄、生成富含意義的文字圖像、創作趣味漫畫,乃至複雜的科學實驗圖解,GPT-4o 皆能輕鬆應對,展現其強大的多模態能力。
新聞 Pixel 三月功能更新:Gemini Live 操作更容易、Pixel Watch 加入更多健康功能 洪詩詩 發表於 2025年3月11日 16:00 Plurk Google 近期推送 Pixel 更新,主要更新包含 Gemini Live 互動方式、Pixel Watch 也加入更多健康相關功能。
新聞 超越 GPT-4?Nvidia 開源 720 億參數 AI 模型 NVLM-D-72B,圖像理解、文字能力全面升級! netizen 發表於 2024年10月03日 09:00 Plurk Nvidia 丟下震撼彈:全新 AI 模型開源、規模龐大,準備好與 GPT-4 匹敵
新聞 Meta發佈最強開源AI模型 Llama 3.2:視覺模型趕超GPT-4o mini,還有可單獨安裝在手機上的版本 cnBeta 發表於 2024年9月26日 11:12 Plurk Llama 3.2:視覺模型趕超GPT-4o mini,1B端側模型媲美Gemma
新聞 「大型語言模型」名不符實?專家籲正名,馬斯克也參戰! bigdatadigest 發表於 2024年9月17日 13:00 Plurk AI 專家卡帕斯認為「大型語言模型」(LLM)名稱不準確,應改為更通用的「自回歸序列轉換模型」。此觀點引發廣泛討論。
新聞 阿里雲推出全新視覺語言模型Qwen2-VL,可分析超過 20 分鐘長的影片,實現AI「類人視覺感知」 netizen 發表於 2024年9月01日 09:00 Plurk 中國電子商務巨頭阿里巴巴的雲端服務和儲存部門阿里雲宣布推出其最新先進的視覺語言模型 Qwen2-VL,旨在增強視覺理解、影片理解和多語言文本圖像處理。