国产欧美日韩三区_偷窥自拍亚洲色图精选_久久大片网站_成人在线黄色_成人亚洲免费视频_99久久久精品_国产美女自拍_韩国19禁主播vip福利视频_色综合视频一区二区三区日韩_日本在线观看一区二区

當前位置:首頁 > 科技  > 網絡

DeepSeek昨天開源的新模型 有點邪門

來源: 責編: 時間:2025-10-22 13:25:10 48觀看
導讀 DeepSeek 又整出新東西來了,只用到原本十分之一 token,就能存下幾乎一樣的文字信息,這壓縮比,香農看了都要流淚,馮·諾伊曼看了都要沉默。更是直接把一堆老外給釣成了翹嘴。昨天,DeepSeek 發布了新模型 Dee

DeepSeek 又整出新東西來了,只用到原本十分之一 token,就能存下幾乎一樣的文字信息,這壓縮比,香農看了都要流淚,馮·諾伊曼看了都要沉默。gUw28資訊網——每日最新資訊28at.com

更是直接把一堆老外給釣成了翹嘴。gUw28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門gUw28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門gUw28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門gUw28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門gUw28資訊網——每日最新資訊28at.com

昨天,DeepSeek 發布了新模型 DeepSeek-OCR,OCR 這東西咱們都熟悉,就是把圖片里的文字給識別出來。gUw28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門gUw28資訊網——每日最新資訊28at.com

經常用微信的差友應該知道,微信客戶端里的圖片,被咱們點開后,是可以直接復制文字的。gUw28資訊網——每日最新資訊28at.com

沒錯,這就是一種 OCR 技術的應用。gUw28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門gUw28資訊網——每日最新資訊28at.com

但是 DeepSeek 這次的 「技能 OCR」則是剛好相反,它可以把大量文字變成一張圖片,作為 AI 的“記憶載體”。gUw28資訊網——每日最新資訊28at.com

是的,用文字來存儲信息,已經不夠滿足它了。gUw28資訊網——每日最新資訊28at.com

過去的大模型,不管是什么 ChatGPT、Gemini、Llama、Qwen、還是 DeepSeek 過去的自己,在讀取數據的用的都是一種方式:文字,也就是平時常說的 token。gUw28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門gUw28資訊網——每日最新資訊28at.com

我們寫的 Prompt,會被轉換成一大堆的 token 給大模型,我們提供的參考資料,會被轉換成一大堆的 token 給大模型,就算是能識別圖像的多模態的大模型,也是要先把圖片轉換成了一段文字描述,來交給大模型來做辨認才行。gUw28資訊網——每日最新資訊28at.com

但文字 token 真的就是大模型理解世界的唯一方式么?gUw28資訊網——每日最新資訊28at.com

DeepSeek 決定試一試新的路子,畢竟,如果咱們把一張圖片和一段文字放在一起,前者明顯可以包含下更多的信息。gUw28資訊網——每日最新資訊28at.com

比如這個描述,就不夠全面gUw28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門gUw28資訊網——每日最新資訊28at.com

既然如此,那我們能不能直接用圖片來訓練大模型?gUw28資訊網——每日最新資訊28at.com

于是 DeepSeek 就開始整,結果發現這個用圖片訓練出來的模型,既中看,又中用。gUw28資訊網——每日最新資訊28at.com

一方面,它可以用更少的 token,來記住更多的內容。gUw28資訊網——每日最新資訊28at.com

在測試文檔理解能力的任務里,DeepSeek-OCR 只用了 100 個視覺 token, 就超過了需要 256 個 token 的 GOT-OCR 2.0。gUw28資訊網——每日最新資訊28at.com

再放狠點,它用 不到 800 個視覺 token, 就吊打了平均要 6000+ token 的 MinerU 2.0。gUw28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門gUw28資訊網——每日最新資訊28at.com

這就意味著、當我們讓大模型開始使用圖像的這種方式來記住數據了之后,模型就有能力用更少的token資源,來取得更好的表達效果。gUw28資訊網——每日最新資訊28at.com

另外,DeepSeek-OCR 還支持多種分辨率和壓縮模式,來適應不同復雜度的文檔:gUw28資訊網——每日最新資訊28at.com

比如說一張只有圖片背景和標題文案的 PPT,可能只需要 64 個 視覺token 就足夠表示了。gUw28資訊網——每日最新資訊28at.com

如果這頁的文字內容比較多,那就會自動切換到 Large 模式,用上多 400 個 視覺token 來記錄。gUw28資訊網——每日最新資訊28at.com

如果覺得還不夠的話,DeepSeek-OCR 還能支持動態調整的 Gundam 模式來記憶圖片,主打一個應記就記,分清輕重緩急的記。gUw28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門gUw28資訊網——每日最新資訊28at.com

而且比起過去只能識別文字的傳統模型來說,DeepSeek-OCR 能記住的數據還會更多。gUw28資訊網——每日最新資訊28at.com

論文里的一張柱狀體,DeepSeek-OCR 能夠自動把它給識別成 Excel 格式給保存下來。gUw28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門gUw28資訊網——每日最新資訊28at.com

文章里出現的有機化合物的分子結構圖片,也能自動轉化為標準的 SMILES(簡化分子線性輸入規范)格式存儲。gUw28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門gUw28資訊網——每日最新資訊28at.com

不但能記住圖片本身,DeepSeek-OCR 還會同時記住這張圖片的位置,記住圖片附近的文字在寫些什么東西。。。gUw28資訊網——每日最新資訊28at.com

過去很多看不到的二維信息,都會被 DeepSeek-OCR 給再次捕獲。gUw28資訊網——每日最新資訊28at.com

這玩意的價值有多大,可能大家一下都還沒意識到。gUw28資訊網——每日最新資訊28at.com

這兩年做大模型,除了顯卡不夠之外的大問題,就是沒有訓練的數據了。gUw28資訊網——每日最新資訊28at.com

常規的數據集之前都用過了,想要再搞點高質量的數據集,要么偷偷去網上爬,要么花大價錢去買,再要么就是想辦法自己合成。gUw28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門gUw28資訊網——每日最新資訊28at.com

但現在,很多過去沒采集到的數據,就可以在二維信息里被采集到了。gUw28資訊網——每日最新資訊28at.com

就比如說很多論文文件,過去,大模型只能學到里面的文字信息,但是里面的各種圖表,插圖那都是兩眼一摸黑。gUw28資訊網——每日最新資訊28at.com

但用上了 DeepSeek-OCR 之后,就可以把之前缺的這部分給無痛補上了。gUw28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門gUw28資訊網——每日最新資訊28at.com

實際上 DeepSeek 也是這么想的,在論文里還特意提了一嘴,說這個新模型在一張 A100 上,一天可以給大模型采集出 20 萬頁以上的訓練數據。gUw28資訊網——每日最新資訊28at.com

所以說,在有了 DeepSeek-OCR 之后,過去的所有數據都值得用它來再識別一遍。gUw28資訊網——每日最新資訊28at.com

毫無疑問,這些數據,又會成為下一個大模型的養料。gUw28資訊網——每日最新資訊28at.com

另一方面,用二維的方式來存儲數據后,整個模型運行起來也變得更省資源了。gUw28資訊網——每日最新資訊28at.com

咱都知道,我們在用大模型的時候,聊天聊的越久、上下文越長,這個模型就越容易出 bug。gUw28資訊網——每日最新資訊28at.com

這是因為大模型在運行的時候,要處理每一個單詞,和其他所有單詞的關系。gUw28資訊網——每日最新資訊28at.com

你把對話的長度增加一倍,整個模型的計算量就增加了四倍,增加了兩倍,那整個模型的計算量就變成了原本的九倍。gUw28資訊網——每日最新資訊28at.com

這也是為啥現在大模型廠商都在給你限制上下文長度的原因之一,你要是在一個對話里聊的太嗨了的話,成本要直接卷上天去了。gUw28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門gUw28資訊網——每日最新資訊28at.com

而在用上了圖像記憶之后,DeepSeek 可以把 token 的數量,壓縮到原本的十分之一。。。gUw28資訊網——每日最新資訊28at.com

同時,還不會讓性能有太大的損失。gUw28資訊網——每日最新資訊28at.com

在論文里可以看到,初出茅廬的 DeepSeek-OCR,就能用原本 1/10 的token 數量,達到原模型 96.5%的準確率。gUw28資訊網——每日最新資訊28at.com

即使哥們再狠點,給它壓縮個20倍,模型的準確率,也還能保持個六成左右。。。gUw28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門gUw28資訊網——每日最新資訊28at.com

同時,DeepSeek 的研究人員還發現了一件好玩的事情。gUw28資訊網——每日最新資訊28at.com

他們會感覺大模型通過不同的清晰度來存儲圖像的方式,其實和我們人類遺忘信息的方式很像。gUw28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門gUw28資訊網——每日最新資訊28at.com

對我們人類來說,遺忘是一個循序漸進的過程。gUw28資訊網——每日最新資訊28at.com

剛發生的事情,就有點像是 DeepSeek 用 Gundam 模式存下來的數據,清晰。gUw28資訊網——每日最新資訊28at.com

而隨著時間的推移,這件事的重要性也會逐漸降低,存儲它的格式也會從大的 Gundam 一路降級,從 Large 一路降到小的 Tiny,占用的 token 數量也會越來越少。gUw28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門gUw28資訊網——每日最新資訊28at.com

把這個概念引入到大模型里的話,咱們就可以把近的聊天記錄,用“4K HDR藍光” 的格式來存儲,而那些早年不太重要的聊天記錄,則是給壓縮成 480P 的文件保存。gUw28資訊網——每日最新資訊28at.com

通過這種主動遺忘的方式,是否能讓大模型的上下文能力變得更強呢?gUw28資訊網——每日最新資訊28at.com

這個想法很有意思,只不過目前就連 DeepSeek 自己也沒能給出一個明確的答案。gUw28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門gUw28資訊網——每日最新資訊28at.com

不過好在 DeepSeek-OCR 還是和過去一樣開源的,相信這個問題,要不了多久就會變成熱門,整出不少新東西來。gUw28資訊網——每日最新資訊28at.com

后,提到開源,我還注意到另外一件事。。。gUw28資訊網——每日最新資訊28at.com

這次研究不但是 DeepSeek 自己的成果,也是開源社區集體的勝利gUw28資訊網——每日最新資訊28at.com

比如訓練數據里,用到了 華為的 Wukong 數據集,在生成樣本文字時,借助了 百度的 PaddleOCR,而在圖像特征提取部分,核心組件竟然是 Meta 開源的 SAM,在視覺語義理解層面,還整合了 OpenAI 的 CLIP 模型。gUw28資訊網——每日最新資訊28at.com

DeepSeek昨天開源的新模型 有點邪門gUw28資訊網——每日最新資訊28at.com

正是這些來自全球的開源成果,被 DeepSeek 重新編織成了一個能“用圖片思考”的 AI。gUw28資訊網——每日最新資訊28at.com

所以,R2 什么時候會來呢。gUw28資訊網——每日最新資訊28at.com


文章出處:差評

本文鏈接:http://m.yifxia.cn/showinfo-17-184425-0.htmlDeepSeek昨天開源的新模型 有點邪門

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: OpenAI也缺卡!僧多粥少 自曝內部搶卡搶到發瘋

下一篇: 又菜又愛玩的荷蘭人 在安世半導體上翻車了

標簽:
  • 熱門焦點
  • 7月安卓手機性能榜:紅魔8S Pro再奪榜首

    7月份的手機市場風平浪靜,除了紅魔和努比亞帶來了兩款搭載驍龍8Gen2領先版處理器的新機之外,別的也想不到有什么新品了,這也正常,通常6月7月都是手機廠商修整的時間,進入8月份之
  • K6:面向開發人員的現代負載測試工具

    K6 是一個開源負載測試工具,可以輕松編寫、運行和分析性能測試。它建立在 Go 和 JavaScript 之上,它被設計為功能強大、可擴展且易于使用。k6 可用于測試各種應用程序,包括 Web
  • Rust中的高吞吐量流處理

    作者 | Noz編譯 | 王瑞平本篇文章主要介紹了Rust中流處理的概念、方法和優化。作者不僅介紹了流處理的基本概念以及Rust中常用的流處理庫,還使用這些庫實現了一個流處理程序
  • JVM優化:實戰OutOfMemoryError異常

    一、Java堆溢出堆內存中主要存放對象、數組等,只要不斷地創建這些對象,并且保證 GC Roots 到對象之間有可達路徑來避免垃 圾收集回收機制清除這些對象,當這些對象所占空間超過
  • 10天營收超1億美元,《星鐵》比《原神》差在哪?

    來源:伯虎財經作者:陳平安即便你沒玩過《原神》,你一定聽說過的它的大名。恨它的人把《原神》開服那天稱作是中國游戲史上最黑暗的一天,有粉絲因為索尼在PS平臺上線《原神》,怒而
  • 最薄的14英寸游戲筆記本電腦 Alienware X14已可以購買

    2022年1月份在國際消費電子展(CES2022)上首次亮相的Alienware新品——Alienware X14現在已經可以購買了,這款筆記本電腦被譽為世界上最薄的 14 英寸游戲筆
  • 電博會與軟博會實現"線下+云端"的雙線融合

    在本次“電博會”與“軟博會”雙展會利好條件的加持下,既可以發揮展會拉動人流、信息流、資金流實現快速交互流動的作用,繼而推動區域經濟良性發展;又可以聚
  • Meta盲目擴張致超萬人被裁,重金押注元宇宙而前景未明

    圖片來源:圖蟲創意日前,Meta創始人兼CEO 馬克·扎克伯發布公開信,宣布Meta計劃裁員超11000人,占其員工總數13%。他公開承認了自己的預判失誤:“不僅
  • 北京:科技教育體驗基地開始登記

      北京“科技館之城”科技教育體驗基地登記和認證工作日前啟動。首批北京科技教育體驗基地擬于2023年全國科普日期間掛牌,后續還將開展常態化登記。  北京科技教育體驗基
Top 青青久久精品| 欧美一级视| 国产伦久视频免费观看 视频| 久久国产影院| 国产高清在线精品一区二区 | 国产91精品一区| 成人影视在线播放| 国产麻豆精品| 成人高清免费| 天天色色网| 韩国三级视频网站| 欧美激情一区二区三区视频| 精品视频免费观看| 久久精品欧美一区二区| 免费国产在线视频| 成人a大片高清在线观看| 一级女性全黄生活片免费| 日韩男人天堂| 麻豆系列 在线视频| 欧美激情一区二区三区视频 | 日本免费看视频| 999精品在线| 日韩一级黄色| 美女被草网站| 国产91丝袜在线播放0| 国产激情一区二区三区| 日韩在线观看免费完整版视频| 精品视频免费在线| 日韩一级精品视频在线观看| 一本高清在线| 韩国三级视频在线观看| 精品美女| 欧美a免费| 日韩免费片| 人人干人人草| 国产麻豆精品免费密入口| 麻豆系列 在线视频| 欧美国产日韩在线| 国产一区精品| 国产精品123| 91麻豆国产| 日本免费看视频| 日韩中文字幕在线观看视频| 高清一级片| 韩国毛片 免费| 国产麻豆精品视频| 色综合久久久久综合体桃花网| 99色视频在线| 天天做人人爱夜夜爽2020毛片| 成人免费观看视频| 色综合久久天天综合观看| 日韩专区一区| 黄视频网站免费观看| 亚洲女人国产香蕉久久精品| 日本特黄特色aaa大片免费| 欧美夜夜骑 青草视频在线观看完整版 久久精品99无色码中文字幕 欧美日韩一区二区在线观看视频 欧美中文字幕在线视频 www.99精品 香蕉视频久久 | 一级女性大黄生活片免费| 九九九在线视频| 一级女性大黄生活片免费| 国产国语对白一级毛片| 日韩av成人| 亚洲精品影院| 国产成人啪精品视频免费软件| 999久久狠狠免费精品| 国产视频一区二区在线播放| 日韩中文字幕在线播放| 国产韩国精品一区二区三区| 好男人天堂网 久久精品国产这里是免费 国产精品成人一区二区 男人天堂网2021 男人的天堂在线观看 丁香六月综合激情 | 精品国产香蕉在线播出| 国产伦久视频免费观看 视频| 九九九在线视频| 毛片高清| 国产视频一区二区在线观看| 国产韩国精品一区二区三区| 一本伊大人香蕉高清在线观看| 国产一区二区福利久久| 亚洲 欧美 91| 久久国产精品永久免费网站| 成人在免费观看视频国产| 人人干人人插| 精品久久久久久中文字幕一区| 久久成人性色生活片| 亚洲精品影院一区二区| 99久久精品国产国产毛片| 国产高清视频免费| 国产成人精品影视| 久久久久久久免费视频| 亚洲精品影院一区二区| 国产a网| 精品国产一区二区三区久| 欧美激情一区二区三区中文字幕| 999久久66久6只有精品| 国产一区二区精品久久| 欧美另类videosbestsex| 欧美大片aaaa一级毛片| 日韩专区第一页| 99色视频在线| 国产福利免费观看| 亚洲 国产精品 日韩| 欧美18性精品| 欧美大片一区| 国产91精品一区二区| 亚欧成人乱码一区二区| 日韩在线观看免费| 亚洲精品中文字幕久久久久久| 91麻豆国产福利精品| 黄色福利片| 91麻豆精品国产自产在线观看一区 | 高清一级做a爱过程不卡视频| 久久久久久久免费视频| 美国一区二区三区| 欧美夜夜骑 青草视频在线观看完整版 久久精品99无色码中文字幕 欧美日韩一区二区在线观看视频 欧美中文字幕在线视频 www.99精品 香蕉视频久久 | 欧美1区| 青青久久精品| 国产原创视频在线| 国产福利免费观看| 亚洲精品影院久久久久久| 九九干| 欧美一级视| 青青久久精品| a级黄色毛片免费播放视频| 可以免费看污视频的网站| 可以免费看污视频的网站| 日韩专区在线播放| 精品视频在线观看一区二区 | 色综合久久天天综合| 91麻豆精品国产自产在线| 色综合久久天天综合绕观看| 久草免费在线色站| 好男人天堂网 久久精品国产这里是免费 国产精品成人一区二区 男人天堂网2021 男人的天堂在线观看 丁香六月综合激情 | 四虎久久精品国产| 午夜在线影院| 台湾美女古装一级毛片| 久久国产精品只做精品| 一级片片| 国产视频久久久久| 国产高清在线精品一区二区 | 韩国三级香港三级日本三级| 韩国三级香港三级日本三级| 四虎影视库| 成人影院久久久久久影院| 久久国产精品自线拍免费| 欧美另类videosbestsex高清| 欧美a级大片| 中文字幕一区二区三区精彩视频 | 二级特黄绝大片免费视频大片| 四虎影视久久| 国产麻豆精品免费密入口| a级毛片免费全部播放| 国产伦久视频免费观看 视频| 青青青草影院 | 韩国三级香港三级日本三级| 免费国产在线观看| 可以免费看污视频的网站| 欧美电影免费看大全| 日韩一级黄色| 国产不卡在线播放| 天天色色网| 成人高清护士在线播放| 九九九在线视频| 欧美爱色| 亚洲 国产精品 日韩| 欧美激情一区二区三区在线| 好男人天堂网 久久精品国产这里是免费 国产精品成人一区二区 男人天堂网2021 男人的天堂在线观看 丁香六月综合激情 | 亚洲不卡一区二区三区在线| 成人免费网站视频ww| 欧美大片一区| 黄色免费网站在线| 欧美a级片视频| 国产高清视频免费观看| 久草免费在线视频| 免费毛片播放| 国产麻豆精品视频| a级精品九九九大片免费看| 欧美激情一区二区三区视频| 九九热国产视频| 精品国产香蕉在线播出 | 成人在免费观看视频国产| 亚洲精品影院久久久久久| 国产激情一区二区三区| 高清一级毛片一本到免费观看| 国产成人欧美一区二区三区的| 青青青草影院 | 你懂的在线观看视频| 成人免费一级毛片在线播放视频| 精品国产亚洲一区二区三区| 精品国产香蕉在线播出| 99色视频在线| 日韩一级精品视频在线观看| 精品国产香蕉在线播出 | 国产网站免费| 日韩免费在线观看视频| 精品视频免费观看| 国产麻豆精品免费视频| 香蕉视频三级| 亚洲爆爽| 天天做日日干| 午夜欧美成人久久久久久| 精品国产亚洲一区二区三区| 精品国产一区二区三区精东影业|