后又发布消息:“感谢网友的热心提醒,Colossal-AI此前发布对DeepSeek-R1(671B)模型的LoRA微调,在参数加载过程中因参数名称不匹配的Bug导致Loss异常,已在GitHub线上修复。”
除此之外,潞晨科技创始人尤洋和硅基流动创始人袁进辉,在社交平台公开互怼的内容也引来了大量吃瓜群众。
这是两家大模型服务公司。尤洋质疑硅基流动的商业模式和技术水平,袁进辉则回应并指责潞晨科技存在抄袭行为。随后,潞晨科技宣布将暂停DeepSeek API服务。
事件发生的背景是:春节期间DeepSeek访问量暴增经常无法访问,硅基流动趁此机会发出了DeepSeek API并对自己的产品做了一宣传,因此发出了不少代金券,其网站访问量也随之大增。
周末,尤洋在知乎发文《坑人的硅基流动》,表示硅基流动的袁进辉老师频繁在朋友圈里阴阳他,并称“这家公司疑似组织水军在网上长期黑我。今天DeepSeek有一篇文章指向我,他也在那里煽风点火。”
2月12日superclue发布评测把硅基流动的API性能排到倒数第一,袁进辉老师发朋友圈说不公平。
其实我觉得superclue是公平的,因为实质上评测的就是硅基流动的付费版的。如果这不是付费版的,小红书那帮单纯的学生岂不是被骗了?代金券还有意义吗?
这种拉人头的传销方式其实不太好,周鸿祎老师前几天还发了个类似的道歉视频。潞晨科技也想过用这种方式,但是我们平台背后是真算力,真的无法贬值。
硅基流动PR稿里说自己有300万用户,我看小红书很多用户说自己的代金券刷到了1000元。假定平均每个用户500元,这样硅基流动有15亿的代金券需要兑现,但是这家公司只有1—2亿的现金。风险很大。所以他们必须要模型。
对此,硅基流动创始人袁进辉在朋友圈公开回应,并透露“硅基流动被潞晨科技抄袭,只是为了给对方留个面子没有公开。”
3月1日,DeepSeek在知乎上发表题为《DeepSeek-V3/R1 推理系统概览》的文章,全面揭晓V3/R1 推理系统背后的关键秘密。最为引人注目的是,文章首次披露了DeepSeek的理论成本和利润率等关键信息。
不过,DeepSeek也强调,实际上的收入或许并没有那么多,因为V3的定价相较于R1要更低,另外夜间还会有折扣。
2月26日,DeepSeek在其API开放平台发布错峰优惠活动通知。根据通知,北京时间每日00:30-08:30为错峰时段,API调用价格大幅下调,其中DeepSeek-V3降至原价的50%,DeepSeek-R1降至25%。DeepSeek鼓励用户在该时段调用,享受更经济更流畅的服务体验。
根据模型价格细节,在标准时段(北京时间08:30-00:30),V3和R1的百万tokens输入(缓存命中)价格分别为0.5元和1元,百万tokens输出分别为8元和16元,R1均为V3的两倍。而在优惠时段(北京时间00:30-08:30),V3和R1的百万tokens输入(缓存命中)则均降为0.25元,百万tokens输出均降为4元。
不过尤洋的上述言论已经删除。今晨,尤洋发文致歉,称“本人昨天情绪太冲动,说了一些让人误解deepseek infrastructure团队的话。deepseek infrastructure团队技术一流并给开源社区做出巨大贡献。本人诚挚道歉,已经删除不当表述,感谢大家提醒!”。
3月2日晚,众多网友发文称自己的知乎崩了,不仅页面下拉内容消失,呈空屏状态,甚至无法登陆,直接显示“用户认证失败”。知乎的突然崩溃令不少用户不解,截止发稿事件,知乎官方并没有发声说明原...
当下,人工智能创作工具已经成为内容生产的重要辅助手段。人民日报社研究部采访了清华大学教授沈阳,他从七个方面进行了分享,围绕DeepSeek、关于赋能记者和编辑创作、以及未来学科发展等等...
一个好的问题会引来无数好的回答,它们不仅是好奇心和知识探索的体现,更是时代发展和社会变迁的见证。12月20日,“知乎2024”年度盘点系列活动正式上线年的“年度十问”,十大问题覆盖人文...
曝光被性侵女演员隐私为道德法律不容。2月25日晚,微博账号@懂瓜呱被永久禁言。此前,该账号发布了一篇长文,以“茶馆说书”的方式爆料一起涉及知名导演和女演员的刑事案件,对案件细节进行了详...
51今日吃瓜fun必吃大瓜正能量 - 51今日吃瓜fun必吃大瓜正能量官方老版本下载V.6.0.0 - 华融下载站 肖光睿对经济观察报说,数据资产入表,对地方政府...
大鹏导演、主演的电影《长安的荔枝》近日官宣,定档今年暑期档;同名剧版,由雷佳音主演,于去年拍完并发出了预告。 这部“爆款”作品的创造者,是一个...