DeepSeek 發佈新技術 DeepSeek-OCR,通過將舊對話轉換成視覺記憶進行優化,成功提高了 AI 在長上下文中的性能和效率。這種有損壓縮讓 10 倍的資料在對話時得以保留,並且能夠降低運算負擔,展現了中國 AI 在成本優化方面的潛力。
DeepSeek 發佈新技術 DeepSeek-OCR,通過將舊對話轉換成視覺記憶進行優化,成功提高了 AI 在長上下文中的性能和效率。這種有損壓縮讓 10 倍的資料在對話時得以保留,並且能夠降低運算負擔,展現了中國 AI 在成本優化方面的潛力。
Thinking Machines Lab 最近發表了其首款產品 Tinker,這是一個旨在簡化 AI 模型微調的開發者平台。Tinker 透過託管服務減少了對基礎設施的需求,使開發者能更專注於演算法。此外,它提供靈活的 API 和先進的微調技術,促進了模型客製化與微調服務的發展。
AI 時代的迷霧與探索 「一架沒有人類正副駕駛在上面,完全由 AI 無人駕駛的飛機你敢坐嗎?」每次我問大家這個 […]
摘要 2025 年 4 月初,Meta 發布了其最新一代大型語言模型系列 Llama 4,包含 Llama 4 […]
「9.11 和 9.8,哪個數字比較大?」一直到不久前,大部分的 AI 都會答錯這個題目,也因此引來不少人嘲笑 […]