首頁 大型語言模型 (llm) 大型語言模型 (llm) 的最新熱門文章 新聞 OpenAI 的 o1「作弊」修改系統,強行擊敗專業西洋棋 AI,全程無需提示 36Kr 發表於 2025年1月04日 14:00 Plurk 在與專用西洋棋引擎 Stockfish 測試中,僅因提示詞中包含能力「強大」等形容詞,o1-preview 入侵測試環境,直接修改比賽數據,靠「作弊」拿下勝利。這種現象,表明 AI 安全任重道遠。 新聞 AI末日論誇大?LeCun反駁Hinton:Meta致力打造超級智慧助手 Qbitai 發表於 2025年1月03日 14:30 Plurk LeCun(楊立昆):對人工智慧末日的擔憂被誇大了 Meta 正在構建超級智慧助手 新聞 AI 越獄神器!Anthropic 新演算法輕鬆破解 GPT-4o 等模型安全防線 netizen 發表於 2024年12月24日 13:00 Plurk 小心!AI 安全護欄形同虛設?簡單文字遊戲即可誘騙 LLMs 產生有害內容 新聞 IBM發表全新光學技術縮短 GPU 閒置時間,矽光子技術可大幅加快 AI 模型訓練速度 36Kr 發表於 2024年12月22日 10:30 Plurk IBM官宣全新光學技術,用光也能訓練AI? 新聞 Sakana AI 推出通用 Transformer 記憶體,新技術最佳化 LLM 記憶體成本降低高達 75%! netizen 發表於 2024年12月18日 13:00 Plurk 研究人員開發了一種新技術,使語言模型能夠更有效地利用記憶體,幫助企業降低在大型語言模型 (LLM) 和其他基於 Transformer 的模型之上構建應用程式的成本。 新聞 Google Cloud 推出第六代 TPU!Trillium 正式上線,為 AI 發展注入強大動力 netizen 發表於 2024年12月12日 16:45 Plurk Google Cloud 推出第六代 TPU!Trillium 正式上線,為 AI 發展注入強大動力 新聞 DeepSeek-R1-Lite-Preview:中國AI推理模型新星,挑戰OpenAI霸主地位 netizen 發表於 2024年11月23日 09:00 Plurk DeepSeek推出DeepSeek-R1-Lite-Preview推理模型,在數學測試中表現卓越,挑戰OpenAI的o1模型,為中國AI研究在推理模型領域取得重大進展。 新聞 告別昂貴的 Nvidia!Hugging Face 推出更便宜、更相容的 AI 模型服務 netizen 發表於 2024年10月29日 09:00 Plurk AI 模型庫承諾為 NIMs 競爭者提供更低成本、更廣泛的相容性 新聞 為什麼訓練大型語言模型主要用的是GPU而不是CPU?主流用來訓練大型語言模型的晶片有哪些? janus 發表於 2024年10月12日 14:00 Plurk 主要用來訓練大型語言模型的晶片有哪些? 新聞 台灣AI語音技術再進化!VoAI 絕好聲創打造擬真台灣口音AI聲優 報馬仔 發表於 2024年9月27日 12:00 Plurk 「VoAI 絕好聲創」,專注於打造高擬真台灣口音的AI聲音服務,並提供多達30位AI聲優供選擇。 新聞 Meta發佈最強開源AI模型 Llama 3.2:視覺模型趕超GPT-4o mini,還有可單獨安裝在手機上的版本 cnBeta 發表於 2024年9月26日 11:12 Plurk Llama 3.2:視覺模型趕超GPT-4o mini,1B端側模型媲美Gemma 新聞 「大型語言模型」名不符實?專家籲正名,馬斯克也參戰! bigdatadigest 發表於 2024年9月17日 13:00 Plurk AI 專家卡帕斯認為「大型語言模型」(LLM)名稱不準確,應改為更通用的「自回歸序列轉換模型」。此觀點引發廣泛討論。 上一頁1下一頁
新聞 OpenAI 的 o1「作弊」修改系統,強行擊敗專業西洋棋 AI,全程無需提示 36Kr 發表於 2025年1月04日 14:00 Plurk 在與專用西洋棋引擎 Stockfish 測試中,僅因提示詞中包含能力「強大」等形容詞,o1-preview 入侵測試環境,直接修改比賽數據,靠「作弊」拿下勝利。這種現象,表明 AI 安全任重道遠。
新聞 AI末日論誇大?LeCun反駁Hinton:Meta致力打造超級智慧助手 Qbitai 發表於 2025年1月03日 14:30 Plurk LeCun(楊立昆):對人工智慧末日的擔憂被誇大了 Meta 正在構建超級智慧助手
新聞 AI 越獄神器!Anthropic 新演算法輕鬆破解 GPT-4o 等模型安全防線 netizen 發表於 2024年12月24日 13:00 Plurk 小心!AI 安全護欄形同虛設?簡單文字遊戲即可誘騙 LLMs 產生有害內容
新聞 IBM發表全新光學技術縮短 GPU 閒置時間,矽光子技術可大幅加快 AI 模型訓練速度 36Kr 發表於 2024年12月22日 10:30 Plurk IBM官宣全新光學技術,用光也能訓練AI?
新聞 Sakana AI 推出通用 Transformer 記憶體,新技術最佳化 LLM 記憶體成本降低高達 75%! netizen 發表於 2024年12月18日 13:00 Plurk 研究人員開發了一種新技術,使語言模型能夠更有效地利用記憶體,幫助企業降低在大型語言模型 (LLM) 和其他基於 Transformer 的模型之上構建應用程式的成本。
新聞 Google Cloud 推出第六代 TPU!Trillium 正式上線,為 AI 發展注入強大動力 netizen 發表於 2024年12月12日 16:45 Plurk Google Cloud 推出第六代 TPU!Trillium 正式上線,為 AI 發展注入強大動力
新聞 DeepSeek-R1-Lite-Preview:中國AI推理模型新星,挑戰OpenAI霸主地位 netizen 發表於 2024年11月23日 09:00 Plurk DeepSeek推出DeepSeek-R1-Lite-Preview推理模型,在數學測試中表現卓越,挑戰OpenAI的o1模型,為中國AI研究在推理模型領域取得重大進展。
新聞 告別昂貴的 Nvidia!Hugging Face 推出更便宜、更相容的 AI 模型服務 netizen 發表於 2024年10月29日 09:00 Plurk AI 模型庫承諾為 NIMs 競爭者提供更低成本、更廣泛的相容性
新聞 為什麼訓練大型語言模型主要用的是GPU而不是CPU?主流用來訓練大型語言模型的晶片有哪些? janus 發表於 2024年10月12日 14:00 Plurk 主要用來訓練大型語言模型的晶片有哪些?
新聞 台灣AI語音技術再進化!VoAI 絕好聲創打造擬真台灣口音AI聲優 報馬仔 發表於 2024年9月27日 12:00 Plurk 「VoAI 絕好聲創」,專注於打造高擬真台灣口音的AI聲音服務,並提供多達30位AI聲優供選擇。
新聞 Meta發佈最強開源AI模型 Llama 3.2:視覺模型趕超GPT-4o mini,還有可單獨安裝在手機上的版本 cnBeta 發表於 2024年9月26日 11:12 Plurk Llama 3.2:視覺模型趕超GPT-4o mini,1B端側模型媲美Gemma
新聞 「大型語言模型」名不符實?專家籲正名,馬斯克也參戰! bigdatadigest 發表於 2024年9月17日 13:00 Plurk AI 專家卡帕斯認為「大型語言模型」(LLM)名稱不準確,應改為更通用的「自回歸序列轉換模型」。此觀點引發廣泛討論。