清明时节雨纷纷

清明时节雨纷纷,路上行人欲断魂;借问小路何处有,到处都是人人人.
无名氏

5.1堵,10.1堵,没想到清明也堵。还好我因为穷,把旅游给戒了。

畅想一下AI手机和PC

今天突然想看看现在最新的AI手机和PC什么样,在B站上搜索了一下AI手机和AI PC,跟我想要的还是存在巨大的差距的。目前的这些AI pc、AI手机,不知道是厂商藏着掖着还是赶发布时间,做的都还很初级。例如三星S24Ultra,无非就是原来的AI抠图改图功能更进一步【参考1】。联想的AI PC,也不过是实现了某些隐藏较深的功能的对话式调用【参考2】。再如荣耀的AI功能,也不过是屏幕OCR功能的延申和进一步优化【参考3】。目前似乎还没有设备能够充分利用到LLM多轮对话、推理、任务编排、数据处理、API调用等功能。

畅想一下我想要并且认为根据目前的技术是可以实现的。(可能面临工程问题,但是非原理性问题)

首先,本地肯定是需要跑一个大模型的,这个大模型需要兼顾能力、体积和功耗。目前这个领域也是一个大家在卷的领域,顶尖工程师们正在想方设法将大模型放入pc和手机中【参考4】,相信很快就能出现兼顾功能、体积和功耗的大模型了。

其次可以一键唤醒跟大模型的交互,这已经是成熟的技术了。手机的语音唤醒或AI键,PC的AI键等都是已经存在的产品设计了。我希望是键盘文字/图形交互和语音交互并存,兼顾语音的方便和文字/图形的精准迅速。例如日常不方便的时候,让AI查下天气、任务清单等简短信息,让AI念出来没什么问题;但是如果需要一段几百字的文字或图形输出,等AI念就太慢了,可能扫一眼就获取到所需的信息了。所以我希望AI能够兼顾文字/语音/图形(例如拍照)的输入,文字、图形和语音输出。

AI要具备本地和互联网操作的能力,正如联想演示的那样,可以跟AI对话来调整屏幕的亮度。这里的实现,还是联想根据自有的软件进行的调用。我希望未来AI支持常用通用软件的使用能力。例如当我让AI看下我的电脑中是否有去年3月跟小A开会的记录时,AI可以操作Everything、微信、飞书等软件,自动查询相关记录给出信息。我还可以语音对话式的控制它增加/减少查找的范围和模糊/精准查找的条件。

在上述基础上,AI还可以帮我撰写相关文档,例如:基于3.12日,3.15日关于B事件的会议的纪要,请撰写一份相关情况汇报,并发送给小C、小D等(涉及外部关键操作(修改配置,调用外部接口等)时,在操作前需要明确得到授权)

AI需要根据我的操作习惯和反馈/偏好,逐步调整自己的行为,成为真正个性化的智能助理。在实现上,无论是通过prompt工程,fine tune还是rag,都是有可能的,但是工程化上应该还是有很多难题。

AI数字人

继Sora视频生成能力之后,OpenAI发布了声音克隆产品。这个市面上也早就有了,不过OpenAI不亏是具有钞能力的团队,据说效果很好,比市面上大多数要好。本周OpenAI不需要注册就可以使用了。

视频克隆和声音克隆越来越成熟了,克隆一个外表意义上的数字克隆人已经可以进入商业化的阶段了,例如殡葬业就推出了类似服务【参考5】。有时我在想,百年之后,我是否愿意以这种方式在这个世界留下一点印记呢?英剧《黑镜》有一集讲的就是一个克隆仿生人的故事,结局不太美好。

xz漏洞继续发酵,ffmpeg指责微软白嫖

上周xz漏洞揭示了开源软件脆弱和艰辛的一面。本周著名开源软件FFmpeg(这个软件非常牛,我也经常用)说微软Teams团队希望FFmpeg开发团队提升一个需求的优先级,但是只愿意出几千块,好尴尬。当然,Teams提这个需求的小团队可能确实没有相关预算,微软财大气粗并不代表每个团队和部门都财大气粗,但是商业公司大量使用开源产品,赚取上千亿美金的事实,确实已经成为目前开源世界愤愤不平的一件事儿,不过这本身也是开源产品的生存之道,这事儿也只能靠自觉。希望FFmpeg借这波舆论,能从巨硬那里多化一点缘吧。当年罗老师带头给openssl捐了一笔,也带动各大商业公司给openssl捐助了一波,罗老师收获了开源世界的赞赏和粉丝们的崇拜,双赢。

Dnspod创始人在推上装X

一直对Dnspod比较有好感,毕竟在白嫖他们家的产品。吴老板当年也是互联网草根偶像了,大专学历,在烟台这种没什么互联网氛围的城市,搞出一个占据大部分份额的互联网基础设施类的产品,引得阿里和腾讯抢购,最终卖出4000万的价格。

本次吴老板在推上说之前有个员工用docker,资源不够来找他,被他开除了,并且说用docker的建一个开除一个。有人问啥原因,吴老板也不解释。我现在个人服务大部分用docker,对docker还是很推崇的,我也很想知道为啥,但吴老板就不说。他说我管几百号人,我还能搞错,于是被群攻。

有人说吴老板装x是为了流量,也有人说吴老板是土皇帝当久了,听不得反对的声音。我兴趣不大,我就想知道docker的应用场景和优劣势。推上有人说大规模应用下,docker的编排是个灾难,或许有空我再深入了解一下吧。

63亿美金

3月18日英国警方判42岁的华裔英国女子简雯参与洗黑钱罪名成立,要没收她价值60亿美金的大饼【参考6,7】。简是被雇佣的助理,本案实际作案人物目前普遍认为是钱志敏,涉案金额430亿人民币。我好奇查了一下,当初互联网每天都在说的钱宝也才300亿,这个天津的p2p案金额这么高,却似乎名不见经传。钱老板被查获的这些大饼,要是中国不去要,可就要给英国警察和内政部发工资了。

要说钱和简,玩这么大,却没把密钥藏好,被英国人找到了。钱出车祸瘫痪,简被抓坐牢,暴富对普通人来说未必是什么好事儿。地势坤,君子厚德载物,这里面的“德”,是“道德”也不简简单单是“道德”,如果没有掌控大笔财富的能力,财富终究是别人的,只是暂时代人保管而已。就算没被警察盯上,也许哪天也会被黑社会盯上,那时候就不是坐牢这么简单了。

其他

小米su7发售,雷军亲自给客户开门:天才少年、一生勤奋、态度谦逊,人生楷模。网上一般认为雷总有两个槽点:1. 耍猴;2. 小米产品质量不如头部厂商。但我想这两项绝非小米或者雷总的槽点,因为这是他们选择的生态位,一般来说也不可能存在质量好、性能高且价格低的产品。小米产品满足了那些对性能有要求,对价格敏感的客户(生态位),同时质量也能做到大厂的水平(虽然不是最好的)。不过我很少买小米的产品,因为我对性能要求不高,主要关注质量可靠。我曾买过一个小米的台灯,一年多就坏了,坏的地方很弱智,一个电源尾插,几毛钱的东西导致200块的东西不能用,很可惜。不过这也可能是产品经理平衡成本和产品质量的难点吧。

万科高管本周被烟台的小股东联名举报【参考8】。万科这个操作在业内是常规操作,我看了一下,21年就有自媒体曝光这种操作【9】。典型属于房地产下行周期,利润减少,一些股东间的矛盾无法弥合被公开(高速发展期可以用钱摆平)。万科的大股东是深圳国资委,而这个举报现在还在网上,看来不止这些地方小股东,还有其他人也对万科高管不满呀。我看红楼梦一直有个疑问,王熙凤搞了那么多钱,都去哪了?

参考

[1] 三星galaxy ai s24Ultra : 抠图、扩图、同传(提升)、不是所有的都叫AI手机,三星S24Ultra Galaxy AI技巧分享_哔哩哔哩_bilibili
[2] 别再问我AI PC和普通PC使用有啥差别了_哔哩哔哩_bilibili
[3] 荣耀的AI功能让春日出游与淄博烧烤完美闭环!_哔哩哔哩_bilibili 依然是传统AI功能的优化和延续,以及LLM对话功能的简单嵌入
[4] E145 | 对话Meta田渊栋:被Transformer改变的世界与人类AGI的野心 - 硅谷101 | 小宇宙 - 听播客,上小宇宙
[5] 聚焦清明|殡葬业创新:对话“永生”AI数智人,“殡葬咖啡馆”不卖咖啡 百年之后,是否愿意被数字永生呢?
[6] 我之前的推理错了—-连夜完整梳理英国63亿美元洗钱案。
[7] 全球最大洗钱案曝光:幕后老板从中国卷款63亿美元潜逃英国,助理“逆袭”成富豪_凤凰网 人生谁能说的清楚呢
[8] 关于郁亮操控万科谋取私利有关情况的反映
[9] 万科重罚刘肖幕后:一个被举报的灰色生意