发布日期:2026-06-11 12:24 点击次数:117


D神又开播了?真的假的?
Deepseek憋了这样久大的,最近终于运转尽情开释了。上周他们刚悄咪咪把 V4 给端了上来,紧接着即是连着两波大降价。。梁神,你又来普度群生了?
效能今天,它又已而来了给我推送了一波灰测:DeepSeek,有多模态才调了,准确来说是识图。
验过了牌,是真的。

想尝鲜的差友现时就不错翻开你的 DeepSeek 瞅一眼。
如果界面里多出了个“识图步地”,恭喜你,你即是被内测到的庆幸儿,径直白嫖真实的多模态版 V4。
DeepSeek自家的征询员陈小康,也按耐不住发了个贴,咱们鲸鱼终于长眼睛了,再也不是国服盲僧了!

为啥大伙儿响应这样首肯?简直是DeepSeek因为没多模态,一经被诟病很深刻,像国际三巨头ChatGPT、Gemini、Claude早就有多模态才调了,国内像豆包、千问等模子也作念得特殊好。
而你这个被委托厚望的国产之光,这样多年了连个图都识别不了,只可靠 OCR,也即是识别图片里的翰墨,使用体验这块确乎拉了一截。
而现时,这块短板终于被补都了。
话未几说,咱们径直上测试吧。
领先,它确乎是开脱了传统的OCR,真能看到图片全貌了,这点大伙不错坦然。
比如咱们给它了一张用蓝色写出来的“这是一滑红字”,如果只用传统OCR,它只可识别出翰墨是“这是一滑红字”,十足识别不出是蓝色的。(致使可能无法识别)
而开启视觉步地后,它不错精确识别出,这是一滑蓝色的红字,致使嗅觉到了我的幽默。
不光如斯,它还有了视觉上的推理才调。
这张梗图寰球都见过吧?信服以差友的智力,十足看得懂图里在写啥。
于是我发给DeepSeek,让它帮我进行笑点融会。
它一番想考事后,不光看出来了,还趁机作念了个原土化翻译“金大利亚”“银大利亚”“铜大利亚”,有点忍俊不禁了。
接着我又发它了一张共事开车时,唾手拍的图片,其实挺糊的,只消些外不雅、光效上的信息不错分析。
效能它照旧猜出来了,这辆车确乎是斯巴鲁,况兼想考13秒就给出了论断。
斟酌到D结识是数学高东谈主,咱们又给它传了一张数学相干的梗图,说真话世超差点都没看懂,是哥们丈育了。
D结识的解说,依旧特殊圆善。
不光整显着了肤浅运算,它致使看出了内部的几个谐音梗:取实部也即是去掉虚数“i”,也即是去掉“Eye”,天博体育app下载也即是把眼睛去掉了。而倒三角是梯度也即是“Grad”,刚好和“Graduate”差未几,是以给小脸带上了学士帽。
一经健忘数学学问的差友们不错逐字复盘一下。
趁机呢,我也测了几个生计中的问题,比如这个3.5mm插头该插那里。
这个方头USB口又该插那里。
天然很肤浅,但它能衔接我没对上焦的唾手拍,也算能胜任闲居任务了。
但其实,凭证世超的实测,D结识现时这个版块,也莫得到天地无敌的地步。
比如咱给它丢了一张图,特殊秀气的地球夜景。
DeepSeek也看得蛮清澈的,说这张像片来自国际空间站。
但其实,你们把像片翻过来望望,就会发现这张像片是一张晚霞底下的城市,这是倒悬过来的视角。。。
然后我丢给了公认的多模态高东谈主Gemini。。。它还真看出来了。不是,降智了都这样强吗?
照旧没能让多模态之王用尽全力吗,哈吉鲸。
开云2026世界杯赛程分析官网包括对一些东谈主脸的识别,亦然偶尔抽风,比如我把豆包的图片扔给了它,它给我识别的是啥,嗯,B站UP主罗翔。
还有这个经典的视错觉问题,这俩球彰着不相似大吧?效能D结识一番想考跟我说俩球相似大。
不外我也去扒了一下它的想考经过,其实它早就看出来右边的球大了,但因为仔细读题,合计这是给它的错觉,是以选拔运用我方,说它们相似大了。。可能是强化学习强化太猛了吧。
详细评价,不错给到一个神鬼二象性,夯的时候夯,拉的时候拉完毕。。
但话又说转头了,DeepSeek刚长出眼睛,咱照旧得给它一些相宜这个寰球的工夫吧。
临了,现时的 AI 巨头大乱斗,早一经过了阿谁只看跑分、只看文本输出才调的生手村阶段了。
Coding 水平、多模态才调、调用器具的丝滑进度等等等等,基本上不能偏废。
但之前大 D 结识在多模态才调上的缺席,总让合计可惜。有种大伙们都在哼哧哼哧作念事干活了, DeepSeeK 却因为缺胳背少眼,Agent 才调大打扣头。
毕竟,现时绝大部分的模子,API 都是带多模态,大致至少是带图片输入才调的。
也期待 DeepSeek 能把识图的多模态才调,尽快更新到 V4 新模子的 API 上头吧。
要知谈,之前蒙着眼睛,一经和不少敌手一经打得有来有回了。。 现时揭下眼罩,到时候用在 Claude Code、龙虾、Cowork 等等器具上的证据,推断还会有一大波的普及。
另外,按照 DeepSeek 这段工夫吐泡泡刷存在感的频率,推断还有一堆连招等着动手呢。
未几说了,看 D 结识扮演吧。