首頁 大型語言模型 (llm) 大型語言模型 (llm) 的最新熱門文章 新聞 Sakana AI 推出通用 Transformer 記憶體,新技術最佳化 LLM 記憶體成本降低高達 75%! netizen 發表於 2024年12月18日 13:00 Plurk 研究人員開發了一種新技術,使語言模型能夠更有效地利用記憶體,幫助企業降低在大型語言模型 (LLM) 和其他基於 Transformer 的模型之上構建應用程式的成本。 新聞 Google Cloud 推出第六代 TPU!Trillium 正式上線,為 AI 發展注入強大動力 netizen 發表於 2024年12月12日 16:45 Plurk Google Cloud 推出第六代 TPU!Trillium 正式上線,為 AI 發展注入強大動力 新聞 DeepSeek-R1-Lite-Preview:中國AI推理模型新星,挑戰OpenAI霸主地位 netizen 發表於 2024年11月23日 09:00 Plurk DeepSeek推出DeepSeek-R1-Lite-Preview推理模型,在數學測試中表現卓越,挑戰OpenAI的o1模型,為中國AI研究在推理模型領域取得重大進展。 新聞 告別昂貴的 Nvidia!Hugging Face 推出更便宜、更相容的 AI 模型服務 netizen 發表於 2024年10月29日 09:00 Plurk AI 模型庫承諾為 NIMs 競爭者提供更低成本、更廣泛的相容性 新聞 為什麼訓練大型語言模型主要用的是GPU而不是CPU?主流用來訓練大型語言模型的晶片有哪些? janus 發表於 2024年10月12日 14:00 Plurk 主要用來訓練大型語言模型的晶片有哪些? 新聞 台灣AI語音技術再進化!VoAI 絕好聲創打造擬真台灣口音AI聲優 報馬仔 發表於 2024年9月27日 12:00 Plurk 「VoAI 絕好聲創」,專注於打造高擬真台灣口音的AI聲音服務,並提供多達30位AI聲優供選擇。 新聞 Meta發佈最強開源AI模型 Llama 3.2:視覺模型趕超GPT-4o mini,還有可單獨安裝在手機上的版本 cnBeta 發表於 2024年9月26日 11:12 Plurk Llama 3.2:視覺模型趕超GPT-4o mini,1B端側模型媲美Gemma 新聞 「大型語言模型」名不符實?專家籲正名,馬斯克也參戰! bigdatadigest 發表於 2024年9月17日 13:00 Plurk AI 專家卡帕斯認為「大型語言模型」(LLM)名稱不準確,應改為更通用的「自回歸序列轉換模型」。此觀點引發廣泛討論。 新聞 高盛發現ChatGPT月使用量斷崖式下跌,但這不代表AI模型「退燒」了 IFENG 發表於 2024年9月17日 10:30 Plurk 高盛發現ChatGPT月訪問量斷崖式下跌 這意味著什麼? 新聞 OpenAI發佈兩款全新推理模型o1、o1 mini,揭開Strawberry的神秘面紗、擁有類似人類思考的事實查核能力 cnBeta 發表於 2024年9月13日 11:23 Plurk OpenAI發佈首款具備推理能力的模型o1 擁有初步的事實查核能力 新聞 Meta最強大型語言模型Llama 3行銷遇挫,被爆亞馬遜和微軟等雲端合作夥伴都「看不上」 IFENG 發表於 2024年9月01日 09:30 Plurk Meta最強大型語言模型Llama 3行銷遇挫:被爆亞馬遜和微軟“看不上” 新聞 什麼是大型語言模型 LLM,6個主流的大型語言模型簡介 janus 發表於 2024年8月31日 14:30 Plurk 目前主流的大型語言模型LLM有哪些,各有什麼優缺點? 上一頁1下一頁
新聞 Sakana AI 推出通用 Transformer 記憶體,新技術最佳化 LLM 記憶體成本降低高達 75%! netizen 發表於 2024年12月18日 13:00 Plurk 研究人員開發了一種新技術,使語言模型能夠更有效地利用記憶體,幫助企業降低在大型語言模型 (LLM) 和其他基於 Transformer 的模型之上構建應用程式的成本。
新聞 Google Cloud 推出第六代 TPU!Trillium 正式上線,為 AI 發展注入強大動力 netizen 發表於 2024年12月12日 16:45 Plurk Google Cloud 推出第六代 TPU!Trillium 正式上線,為 AI 發展注入強大動力
新聞 DeepSeek-R1-Lite-Preview:中國AI推理模型新星,挑戰OpenAI霸主地位 netizen 發表於 2024年11月23日 09:00 Plurk DeepSeek推出DeepSeek-R1-Lite-Preview推理模型,在數學測試中表現卓越,挑戰OpenAI的o1模型,為中國AI研究在推理模型領域取得重大進展。
新聞 告別昂貴的 Nvidia!Hugging Face 推出更便宜、更相容的 AI 模型服務 netizen 發表於 2024年10月29日 09:00 Plurk AI 模型庫承諾為 NIMs 競爭者提供更低成本、更廣泛的相容性
新聞 為什麼訓練大型語言模型主要用的是GPU而不是CPU?主流用來訓練大型語言模型的晶片有哪些? janus 發表於 2024年10月12日 14:00 Plurk 主要用來訓練大型語言模型的晶片有哪些?
新聞 台灣AI語音技術再進化!VoAI 絕好聲創打造擬真台灣口音AI聲優 報馬仔 發表於 2024年9月27日 12:00 Plurk 「VoAI 絕好聲創」,專注於打造高擬真台灣口音的AI聲音服務,並提供多達30位AI聲優供選擇。
新聞 Meta發佈最強開源AI模型 Llama 3.2:視覺模型趕超GPT-4o mini,還有可單獨安裝在手機上的版本 cnBeta 發表於 2024年9月26日 11:12 Plurk Llama 3.2:視覺模型趕超GPT-4o mini,1B端側模型媲美Gemma
新聞 「大型語言模型」名不符實?專家籲正名,馬斯克也參戰! bigdatadigest 發表於 2024年9月17日 13:00 Plurk AI 專家卡帕斯認為「大型語言模型」(LLM)名稱不準確,應改為更通用的「自回歸序列轉換模型」。此觀點引發廣泛討論。
新聞 OpenAI發佈兩款全新推理模型o1、o1 mini,揭開Strawberry的神秘面紗、擁有類似人類思考的事實查核能力 cnBeta 發表於 2024年9月13日 11:23 Plurk OpenAI發佈首款具備推理能力的模型o1 擁有初步的事實查核能力
新聞 Meta最強大型語言模型Llama 3行銷遇挫,被爆亞馬遜和微軟等雲端合作夥伴都「看不上」 IFENG 發表於 2024年9月01日 09:30 Plurk Meta最強大型語言模型Llama 3行銷遇挫:被爆亞馬遜和微軟“看不上”