2025#17 即时零售
本期摘录多,想法少。
文章
表面上看,是京东咄咄逼人的踏入了外卖市场,带来了一些让美团感到威胁的变数,但实际上,依托外卖业务的配送网络,美团早就通过即时零售的服务掏空了京东在仓配体系上多年积累的快速效率,把火烧到了电商的后院。
电商发展到了即时零售版本。美团是从30min送外卖,发展到30min送万物,京东是从24h送万物,发展到30min送万物。外卖只是即时配送的部分订单,美团非餐即时零售1800万单的交付量,已经超过了配送总单量的1/4,足以说明即时配送势不可挡。
Mixture of Experts – Non_Interactive – Software & ML
The fact that MoE has great scaling properties indicates that something deeper is amiss with this architectural construct. This turns out to be sparsity itself – it is a new free parameter to the scaling laws for which sparsity=1 is suboptimal. Put another way – Chinchilla scaling laws focus on the relationship between data and compute, but MoEs give us another lever: the number of parameters in a neural network. Previously compute and quantity of parameters were proportional, but sparsity allows us to modulate this ratio.
MoE最大的创新其实是为scaling laws引入了一个新参数——sparsity,sparsity=1时不是最优的,于是有了MoE。
Instead, MoE transformers lend themselves best to highly distributed serving environments with ultra-large batch sizes and corresponding high latency per token.
MoE天然适合分布式,通过大规模专家并行,提高系统整体的batch size,就像DeepSeek所做的(DeepSeek-V3 / R1 推理系统概览 - 知乎)。
我不爱做事前的计划,因为我对各种结果都很接受,并且享受过程,谢扬的不计划与之完全相反,他抱着某种破釜沉舟的决心,并惯之极强的执行力,因此反而不需要提前担心,他为实现目标所付出的那种坚持,隐忍,对自己的苛责,以及在做这些所有事情背后保持的冷静思考,让我觉得他做任何事都会做成。
有些比较幸运,有些不那么幸运,但是用各种各样的方式,我们都处理好了和上一段创业的关系,并带着之前积累的所有经验,抱负,决心和勇气,投入到这个时代的新故事里。谢扬走的很快,肖弘无疑则有了梦幻开局,与之相比我则慢了很多,但我毫无丢脸的想法,我的脸皮固然很厚,同时我们想实现的事情也完全不一样——他们想将人类效率提高到极致,我则希望让那时候的人类依然保有幸福。
他们的产品都很出色,而DK的是我觉得最有创意和温度的产品,DK的想法总能让人眼前一亮。
为什么感觉市场竞争力随着时间减弱?也就是所谓的程序员 35 岁危机
因而这是自由的双层剥削,第一层你变成了一个劳动者,你的劳动力只能够换钱,不能拿去换别的,这已经将你的自由剥夺了一层。还有另外一件事情,就是你又被绑在一个工作岗位上,**你只能够在这个固定的工作位置上去实现你的劳动价值。**这个固定的工作位置会给你提供安全感,但它同时也就取消了你自由离开这个位置去做其他不同工作的可能性。
能力必须借助公司才能发生作用,是一件好事儿吗?