欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。

# 2024.7.5

今日要闻

李彦宏:开源模型是智商税,智能体正在爆发

李彦宏认为,开源其实是一种智商税。“当你理性地去想,大模型能够带来什么价值,以什么样的成本带来价值的时候,就会发现,你永远应该选择闭源模型。今天无论是ChatGPT、还是文心一言等闭源模型,一定比开源模型更强大,推理成本更低。”

谈及“AI超级应用什么时候出现”时,李彦宏表示,“不是说一定在等待一个超级应用的出现”。他认为,在基础模型之上,应该能够诞生数以百万计的各种各样的应用。“如果仅仅是从0到1,你可能会希望出现某几个Super APP,也就是几个公司从中受益。但是今天,几乎各行各业所有的公司,被大模型加持之后,它都能受益。这种影响力,对于整个社会、对于人类来说,无疑是更大的。”

李彦宏称,智能体代表着AI时代的未来趋势。“智能体正在爆发,只是现在基数还比较小,大家的体感没有那么强烈。”基础模型需要靠应用才能显现出价值,智能体是一个几乎“放之四海而皆准”的基于大模型的应用,由于它门槛足够低,可能你连编程都不用,就可以做出一个效果不错的智能体。“让更多人进来,他们发挥聪明才智,指不定哪条路跑通了,它就是一个Super APP。”

MySQL 9.0“创新版”已支持向量,为何甲骨文却“偷偷摸摸”地宣布?

对于 MySQL 9.0“创新版”,最值得关注的新特性莫过于支持向量数据类型字段类型名称为 VECTOR,可以使 to_vector/string_to_vector/from_vector/vector_dim 等函数操作向量数据。MySQL 9.0 的 Release Notes 写道

此版本中添加了对 VECTOR 列类型的支持。向量 (Vector) 是一种数据结构,由条目列表(4 字节浮点值)组成,可以表示为二进制字符串值或列表格式的字符串。

VECTOR 列声明有最大长度或条目数(在括号中);默认为 2048,最大为 16383。

下面示例是使用 CREATE TABLE 创建包含 VECTOR 列的 InnoDB 表:

mysql> CREATE TABLE v1 (c1 VECTOR(5000));Query OK, 0 rows affected (0.03 sec)

操作向量的相关函数介绍:

  • VECTOR_DIM() 函数用于获取向量的长度
  • STRING_TO_VECTOR()(别名TO_VECTOR())函数采用向量的列表格式表示形式,并返回二进制字符串表示形式
  • VECTOR_TO_STRING()(别名FROM_VECTOR())函数执行和上面相反的操作
mysql> SELECT STRING_TO_VECTOR('[2, 3, 5, 7]');+------------------------------------------------------+| TO_VECTOR('[2, 3, 5, 7]')                            |+------------------------------------------------------+| 0x00000040000040400000A0400000E040                   |+------------------------------------------------------+1 row in set (0.00 sec)mysql> SELECT VECTOR_TO_STRING(0x00000040000040400000A0400000E040);+------------------------------------------------------+| VECTOR_TO_STRING(0x00000040000040400000A0400000E040) |+------------------------------------------------------+| [2.00000e+00,3.00000e+00,5.00000e+00,7.00000e+00]    |+------------------------------------------------------+1 row in set (0.00 sec)

更多信息和示例查阅:VECTOR TypeVector Functions (WL #16081)

通义真正实现全尺寸、全模态开源,下载量已破2000万

在今日的 2024 上海世界人工智能大会上,阿里云 CTO 周靖人公布近期通义大模型和阿里云百炼平台的最新进展:近 2 个月,通义千问开源模型下载量增长 2 倍,突破 2000 万次;阿里云百炼服务客户数从 9 万增长至 23 万,涨幅超 150%。

周靖人重申了阿里云拥抱开源开放的坚定立场,“两年前,我们在世界人工智能大会上发布通义大模型系列,当时我们公布,通义核心模型将开源开放。到今天,通义千问已经实现真正意义上的全尺寸、全模态开源,拉平了开源、闭源模型之间的差距。”

腾讯混元DiT开源6G小显存版本,支持Kohya训练

腾讯混元文生图大模型(混元DiT)宣布开源小显存版本,仅需6G显存即可运行,对使用个人电脑本地部署的开发者十分友好,该版本与LoRA、ControlNet等插件,都已适配至Diffusers库;并新增对Kohya图形化界面的支持,让开发者可以低门槛地训练个性化LoRA模型;同时,混元DiT模型升级至1.2版本,在图片质感与构图方面均有所提升。

此外,腾讯宣布混元文生图打标模型”混元Captioner“正式对外开源。该模型支持中英文双语,针对文生图场景进行专门优化,可帮助开发者快速制作高质量的文生图数据集。


今日观察

用150行C代码超越NumPy的矩阵乘法性能

– 微博 蚁工厂

Windows下的GUI开发

– 微博 量子位

上海AI lab开源多模态LLM:InternLM-XComposer-2.5

– 微博 歸藏的AI工具箱

边学 AI 边赚钱的 GitHub 项目

媒体观察

这些有趣的人形机器人争相登场,它们离实际应用有多远?

多位业内人士表示,倘若机器人未来大规模应用,从制造业到服务业,真正走进公众生活、走近百姓身边,陪护老人、陪教儿童等,还有许多“软硬件”待升级,包括看得见的零部件灵敏度、安全性等,看不见的数据隐私、算法偏见、伦理道德等,都需要有更全面、更优化的解决方案,保障新技术、新产品的安全和可持续发展。

新华社

国内首款人形机器人公版机发布,百亿人形机器人产业基金正在弦上

 21世纪经济报道

硅基流动完成近亿元天使+轮融资 国产大模型“补足弹药”混战升级

今年以来,大模型赛道热闹非凡:一方面国内大模型创业公司打响“价格战”;另一方面,OpenAI宣布终止对中国开发者提供API(应用程序接口)服务也引发了国内大模型争相推出“迁移计划”。与此同时,资本也正在向头部企业进一步聚集。

每日经济新闻

北京商报

大模型落地考,难点在哪里?

所以,大模型的能力在多模态方面的突破,会带来AI的普惠,为AI开启更多的可能性。原来的投入产出是一个金字塔型结构,即投入很大,但是收益很小;只有将它变成一个倒金字塔结构,这样才能真正放大它的价值。

新技术在催生新的产业变迁的同时,也会构建一个新的价值链,AI产业也是如此,从单点爆发到各行业的全方位突破,AI所创造的价值也将是指数级的。

光锥智能

大模型想赚钱,先过这七道难关

中关村科金CTO李智伟博士最近发现,大模型商业闭环,正在被提到很重要的位置。

不同于过去20年间中国IT行业的发展,可以通过烧钱来快速积累用户,靠估值和广告实现商业变现;大模型时代,投资市场愈加理性,正在倒逼业界加快实现商业闭环。

数智前线

工信部赵志国:开放鸿蒙、开源欧拉等优质开源项目正在走向国际舞台

工业和信息化部新闻发言人、总工程师赵志国在“推动高质量发展”系列主题新闻发布会上表示,生态的打造与构建对信息通信业发展极其重要。目前,我国成立了开放原子开源基金会,开放鸿蒙、开源欧拉等优质开源项目正在走向国际舞台。

通信世界网


今日推荐

开源项目

wa-lang/wa

开源日报 | 李彦宏称开源模型是智商税;Windows下的GUI开发;有趣的人形机器人;边学AI边赚钱插图

https://gitee.com/wa-lang/wa

凹语言(凹读音“Wā”)是 针对 WASM 平台设计的通用编程语言,同时支持 Linux、macOS 和 Windows 等主流操作系统和 Chrome 等浏览器环境,同时也支持作为独立 Shell 脚本和被嵌入脚本模式执行。

每日一博

VLMs 多模态大模型当下进展与思考

在过去的一年中,VLMs 技术取得了飞速发展。本文旨在对这些技术进步进行梳理与思考,但将避免深入具体的论文细节,而是用简明扼要的方式介绍每篇研究的核心思想。

开源日报 | 李彦宏称开源模型是智商税;Windows下的GUI开发;有趣的人形机器人;边学AI边赚钱插图1


用户观点

Visual Studio Code 1.91 发布

  • 观点 1:graph终于出现了,希望搞的更牛批点,比webstorm的git图形化还好。大家都去点个赞,加快点速度,让vscode的git更好用!!!github—-com/microsoft/vscode/issues/179053
  • 观点 2:mac更新完,VSC起不来了
  • 观点 3:目前我用Git Graph插件,不过几年没更新了
  • 观点 4:没有独立的git提交界面

李彦宏:没有应用,基础模型不值一提

  • 观点 1:比没有应用更可怕的是没有下限,你的文心一言会不会骗大家去莆田系医院呢?
  • 观点 2:现在有什么问题还是要ChatGPT google。某些搜索引擎搜索出来的东西不能看啊。
  • 观点 3:为了吃入,从一个极端到另一个极端?
  • 观点 4:可以预测的未来,百度越是缺钱,百度搜索体验越差,这简直是一个恶性循环,百度搜索结果前两页全是广告,名副其实的广告搜索。
  • 观点 5:说的也没错,现阶段AI就是适合专向专干。
  • 观点 6:起个大早,赶个晚集。
  • 观点 7:陆奇哭晕在厕所里

Elasticsearch 8.14.2 发布

  • 观点 1:一般用来干嘛?
    • 观点 2:百度搜索
  • 观点 3:前段时间在服务器启动了一个es,结果内存8g被吃掉了,直接选择放弃
    • 观点 4:修改jvm参数,修改内存大小。

美团面了大概四十分钟,全程细节拷打

  • 观点 1:要是没什么干货,大可不必水文章。
    • 观点 2:兄弟,程序员终极归宿是送外卖啊。难道还想登月球?
    • 观点 3:我偏不,我开网约车
  • 观点 4:这送外卖的是程序员出身的可以理解了。但你这面试官怎么还是程序员出身呢?也晋升管理层了是吧?哦,我悟了。[旺柴]前期写代码,如果顺利,可以晋升管理层,如果不顺利,35岁去送外卖了。然后再顺利,也还是能进管理层的啊!
    • 观点 5:外卖面试官还懂out of box呢
  • 观点 6:没问电动车的原理是什么?
  • 观点 7:看完了!小编现在真的改过自新了!或是已经良心发现了!要不然,这种标题,内容百分百是广告。
  • 观点 8:开水团前端感到被冒犯
  • 观点 9:读个大学去做程序员,不做程序员去送外卖,结果发现老大居然是初中毕业就去打工的同学了。会不会很尴尬
  • 观点 10:赶快开班培训一下吧,这个真的很有用
  • 观点 11:互联网的尽头是送外卖
  • 观点 12:兄弟,你这里的“餐”,不会是暗指“数据包”吧,送餐=发包,电话联系=TCP连接,你面的还是程序员对不?

—END—

最后,欢迎扫码下载「开源中国 APP」,阅读海量技术报告、程序员极客分享!

开源日报 | 李彦宏称开源模型是智商税;Windows下的GUI开发;有趣的人形机器人;边学AI边赚钱插图3

免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表一休教程网的观点和立场。