欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。

# 2024.6.3

今日要点

斯坦福抄袭中国大模型

5 月 29 日,斯坦福大学的一个研究团队发布了一个名为”Llama3V”的模型,号称只要 500 美元就能训练出一个 SOTA 多模态模型,且效果比肩 GPT-4V、Gemini Ultra 与 Claude Opus 。由于该团队的作者来自斯坦福,又集齐了特斯拉、SpaceX、亚马逊与牛津大学等机构的相关背景经历,该模型迅速冲到了 Hugging Face 首页。

但没过几天,X 与 Hugging Face 上就有质疑 Llama3V 套壳面壁智能在 5 月中旬发布的 8B 多模态小模型 MiniCPM-Llama3-V 2.5的声音。对此,Llama3V 团队回复,他们”只是使用了 MiniCPM-Llama3-V 2.5 的 tokenizer”,并宣称”在 MiniCPM-Llama3-V 2.5 发布前就开始了这项工作”。

紧接着,6 月 2 日,有网友在 Llama3V 的 Github 项目下抛出事实性质疑,但很快被 Llama3V 的团队删除。为此,提出质疑的网友被激怒暴走,跑到了 MiniCPM-V 的 Github 页面进行事件还原,提醒面壁智能团队关注此事。

随后,面壁团队通过测试 ,发现 Llama3V 与 MiniCPM-Llama3-V 2.5 在”胎记“”般案例上的表现 100% 雷同,”不仅正确的地方一模一样,连错误的地方也一模一样”。

微软 Edge 市场份额创历史新高

知名流量监测机构 Statcounter 公布了 2024 年 5 月份全球桌面浏览器市场份额

开源日报 | 斯坦福抄袭中国大模型;计算机专业是一个好专业;苹果的锁屏密码确实无法破解;和马斯克学辩论;Java最能打;软件的终结插图

主要数据如下:

  • Chrome:64.88%
  • Edge:13.13%
  • Safari:8.8%
  • Firefox:6.64%
  • Opera:3.23%
  • 360 Safe:1.09%
  • ……

上个月,微软 Edge 的全球桌面浏览器市场份额上升至 13.13%,创下历史新高。

微软 WSL 最新进展:即将推出 WSL 设置应用

WSL 集成将通过新的 “Environments” 功能进入 Dev Home 控制中心。用户可以在此管理、启动和创建新的开发环境,还可以在此界面上与 WSL 发行版进行交互。

开源日报 | 斯坦福抄袭中国大模型;计算机专业是一个好专业;苹果的锁屏密码确实无法破解;和马斯克学辩论;Java最能打;软件的终结插图1

首个智慧城市大模型UrbanGPT,全面开源开放|港大&百度

港大、百度联合团队借鉴大型语言模型的思想,提出了一种新型的时空大型语言模型UbanGPT。该模型在多种城市应用场景中展现了出色的普适性。通过结合时空依赖编码器和指令微调方法,该模型增强了对时间和空间复杂关系的理解,即使在数据稀缺的条件下也能提供更精确的预测。

通过一系列广泛的实验,UrbanGPT在多个城市相关的任务上展现了其卓越的性能,并证明了其在零样本学习领域的强大潜力。


今日观察

媒体观察

2024过半,AI大模型卷到哪儿了?

在国内,以阿里、百度为代表的科技大厂还在持续投资,比如阿里就耗资8亿美金,投资了Kimi的母公司月之暗面,占股36%,市场传闻腾讯也在洽谈跟进。

然而,对于推动原始创新和产品落地,这些大厂究竟发挥了多大作用、扮演着什么角色,我们越来越难以评估。大厂一方面自己做大模型,同时又投资了市面上几乎所有的明星创业公司,用股权把对手绑定。甚至这一波被开发者称赞的API降价,也不是由大厂发起,而是一个叫幻方量化的私募巨头,以及创业公司智谱AI带头,随后的大厂跟进,充满了被动和营销的味道。

下半年,行业依然会很卷,毕竟国内大模型从一开始就是竞争驱动的。也许,我们能卷出来几个赢家,爆款应用也不远了?

– 定焦

ChatGPT真能记住你的话吗?DeepMind与开源大佬揭示LLM记忆之谜

LLM有记忆能力吗?有,也没有。虽然ChatGPT聊天时好像可以记住你之前说的话,但实际上,模型在推理时记不住任何内容,而且它们在训练时的记忆方式也不像我们想象的那么简单。

Django框架的创始人之一、著名开发者Simon Willison最近发表了一篇博客文章,核心观点是——虽然很多LLM看起来有记忆,但本质上是无状态函数。

文章地址:https://simonwillison.net/2024/May/29/training-not-chatting/
Mozilla和FireFox的联合创始人、JavaScript发明者Brendan Eich也在推特上称赞这篇博客。

新智元

华为鸿蒙:今年全面挑战谷歌苹果

在软件和互联网行业,弯道超车还可能吗?

这个问题具体到移动操作系统,面对已建立起统治地位的谷歌和苹果,华为鸿蒙还有机会打破对手的垄断吗?

智百道

– 鞭牛士

RISC-V会被制裁吗?能吗?

RISC-V 社区不希望其指令集架构 (ISA) 受到出口或进口制裁,因为这会影响采用并加剧分裂。它希望通过让立法者、政策专家和官员了解社区认为开源和开放规范之间的细微差别来避免打击。

简而言之,他们希望强调的是,对某种产品(例如,某种计算机处理器、付费软件应用程序,甚至开源项目)施加贸易限制是一回事,但对开放标准或规范施加限制则是另一回事。例如,禁止出口某些以太网网络控制器与直接禁止整个以太网出口是不同的。

半导体行业观察

AI大脑让机器人更像人了

大语言模型技术第一次成功模拟了人类的语言系统,让机器人实现与人类自然对话。AI(人工智能)大模型技术的快速更新又让机器人陆续拥有了类似人类的“眼睛”和“耳朵”等感官。

经济观察报

今日推荐

开源项目

dunglas/frankenphp

开源日报 | 斯坦福抄袭中国大模型;计算机专业是一个好专业;苹果的锁屏密码确实无法破解;和马斯克学辩论;Java最能打;软件的终结插图2

https://github.com/dunglas/frankenphp

FrankenPHP 是一个基于 Caddy Web 服务器构建的现代 PHP 应用服务器。特性包括:Early Hints、worker 模式、实时功能、自动 HTTPS、HTTP/2 和 HTTP/3 支持等。

每日一博

从 0 到 1:广告营销多智能体架构落地全攻略

在 AI Native(人工智能原生)时代,广告营销平台经历了根本性的变革,这些变化不仅提升了广告的效率和精准度,还重塑了广告行业的整体运作方式。其中,强大的广告营销智能体是下一代商业广告平台面向客户交付商业价值的首要载体。进一步,生成式 AI 又是广告营销智能体的内核及灵魂,真正达成让客户放开说、简单用、都搞定的极致体验。

图片


用户观点

中国软件行业几乎全军覆没

  • 观点 1:接触过印度和老美的软件外包企业,那才叫你求生不得求死不能,特别是欧美那边指定的印度外包企业。国内算好的了
  • 观点 2:某些国内大厂产品迭代速度慢比蜗牛,甚至做完一批产品就裁一半开发(依据KPI),然后还996搞起,这种厂子GDP贡献再大,也是行业肿瘤,死不足惜,倒是一些小厂,外资,倒了可惜
  • 观点 3:往往是一群不懂软件的人在瞎叫唤[呲牙]。因为,这个列表里的公司根本代表不了国内软件行业最先进的公司。
  • 观点 4:作为甲方祝愿用友早日倒闭
  • 观点 5:狠狠地支持。一个zf单本来可以养活10个创业公司,现在通通被所谓高资质的外包拿走,养活他自己1个,技术嘛白嫖社区和大厂,人员嘛用完就开,我不养闲人,项目质量能交差就行,管他二期能不能拓展,呵呵。
  • 观点 6:一群人卷大家都会做的,最后大家一起死
  • 观点 7:有点极端,看看甲方的烂需求和预算。
  • 观点 8:除了科大讯飞有一个输入法的 toC 业务,都是 toB 的,倒闭了都没什么大影响,还能多点订单给普通创业公司
  • 观点 9:软通这种包工头企业为啥能亏钱,想不通
  • 观点 10:现有项目和东软对接,对方啥也不懂

花2万买MacBook当然是用来安装Linux

  • 观点 1:突然想到了,这个家伙还在世的时候还是要好好珍惜一下他,毕竟他创造了当今应用范围最广的操作系统,而且是全人类开放使用的,所以别忘了这一点。
  • 观点 2:我肯定不是mac用户啊,如果单位发苹果电脑肯定第一时间装Linux。
  • 观点 3:为什么都用arch不用debian
    • 观点 4:因为arch的滚动更新特性就不适合企业使用,个人使用也不会优先选择滚动,只有两种人会选,小白和大佬,前者只会装逼,遇到滚挂基本傻眼,后者可以自定义到lts内核,遇到问题也可以快速解决,普通人不如先从乌班图玩起。
  • 观点 5:我只想反过来在Linux电脑上装mac系统
  • 观点 6:肯定是装 windows 啊,然后 wsl 跑 arch
  • 观点 7:但是我想用Arch
    • 观点 8:不如先从manjaro开始!
    • 观点 9:用过了,不好用,他们用的是自己的repo
  • 观点 10:残废系统,装过两次,一点都不好用,TouchID 没了,触控板也不好用了
  • 观点 11:我自己买的Mac肯定是在虚拟机里安装Linux
    • 观点 12:要是你只需要命令行的话,用multipass装Ubuntu,很香,非常香,体验和wsl类似
  • 观点 13:都说老旧电脑装 linux,上次我用 xp 时代的电脑装了 ubuntu,卡的不行
    • 观点 14:你那玩意只能安装centos或debian

Java是最能打的编程语言

  • 观点:1:我 C# 不服
  • 观点 2:Java纯粹是历史原因,尾大不掉。
    • 观点 3:啥不是历史造就的,繁荣和衰败都是,编程也一样
  • 观点 4:我 Kotlin 不服
    • 观点 5:出来的晚,没啥不可替代的本事。
  • 观点 6:世界是c#的,也是java的,但归根结底是c#的
  • 观点 7:上一个这么说的还是php
  • 观点 8:用的多不等于重要。系统级语言以外的都是蝼蚁。JAVA的市场份额萎缩到 1/4,应用范围是节节败退。 js和Python,只是脚本。被wasm和mojo惦记。错失机会,都不多看它一眼的,就是C#。
  • 观点 9:在web开发领域中,相对于其他语言,如果JAVA未实现这个库,其他语言大概率更不会实现,庞大的生态无可比拟
  • 观点 10:骗兄弟可以,别把自己骗了就好
  • 观点 11:Foreign Function & Memory API 好像当前版本并没有比jni来得快,甚至更差了,而且在vallhala出来前java所有和c的交互都得额外弄一份内存,就算出来了也未必能做到一份二进制数据直接丢到内存当结构体用,等两个api完全稳定了,黄花菜都凉了
  • 观点 12:java 淡出历史舞台了

同样写Python,同样做开源,大佬出手不仅斩获近万颗star,还被诺贝尔奖得主邀请会面

  • 观点:1:你们python就这么不方便吗?以至于出个包管理器都这么隆重?
    • 观点 2:虽然你说了个大实话,不过除了cargo这种伴生的,谁的包管理都是一团麻,golang颠颠倒倒,大金主拿捏的spm swift磕磕碰碰,bundle,venv,npm都不容易啊~ 倒回去点makefile/cmake也算得上包管理 哪一个拿出来都是大家伙~~
  • 观点 3:万能的网友,有人能告诉我那个截图的终端画面,字体和主题配色是啥吗
    • 观点 4:主题看起来像dracula,字体看起来像recursive mono semicausal,感觉像是,错了当我没说
  • 观点 5:pip不好用么?
  • 观点 6:我觉得Python poetry就挺好用的
  • 观点 7:额,这和python -m venv有什么区别吗?
  • 观点 8:这个蛮好用的,最近刚开始用

—END—

最后,欢迎扫码下载「开源中国 APP」,阅读海量技术报告、程序员极客分享!

开源日报 | 斯坦福抄袭中国大模型;计算机专业是一个好专业;苹果的锁屏密码确实无法破解;和马斯克学辩论;Java最能打;软件的终结插图5

免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表一休教程网的观点和立场。