
当下AI圈险些每一周都有新鲜事发生,这反而给了很多创业公司熬出头的时机。(雷峰网雷峰网雷峰网(公家号:雷峰网)) 不管是Clawedbot掀起对于物理世界交互方式的重构,还有是Moltbot上最先会商AI及人类怎样共存的危机感,都于提示市场:真实的时机往往藏于边沿地带,以和看似微小的‘非共鸣’时刻。 好比“播客”这个范畴,即便有短视频及短剧的鼎力大举打击,可是播客赛道仍然火热,按照《CPA中文播客白皮书2026》显示,2025年中文播客听世人数已经冲破1.5亿人,较2023年的1.2亿增加25%。 于年夜量研究外洋对于播客的论文文献以后,开创人冯雷决议选择AI播客这条赛道,其创业路径很是清楚:咱们的方针不是DAU,而是要做一个赚钱的 AI 产物,专注在 1%-3%之内的创作者,这群人颇有创造力,也愿意付费,咱们就办事这群人。 “咱们就是但愿他像一个真人同样,没有太多 AI 表达。只管即便有人味,越天然越好。” 冯雷对于AI科技评论暗示。 作为一家于播客天生范畴做到海内头部的公司,ListenHub选择为内容创作者提供声音克隆、多模态编纂、一键天生讲解视频等专业东西。 公司去年末实现了300万$的ARR,并于近期以5000万$的估值开启新一轮融资。 于成为一位创业者以前,冯雷是Minimax 海螺AI的产物卖力人,最广为人知的是他的小我私家公家号“有机年夜橘子”,更初期于BOSS直聘、兰亭集势、三星等公司就职就职,从事产物司理相干职位。 于对于PMF的理解上,他指出:于传统互联网时代,产物司理的焦点使命是 发明需求-验证模子-范围化复制 ,流程清楚如流水线;而于AI时代,他坦言这套要领论已经经掉效—— 真的是拿锤子找钉子,并且还有真的能找到 。 这类反知识的倒置,源在年夜模子作为通用技能的非凡性,是以于雇用时,冯雷也会警惕经验主义者, 3年以上的产物司理轻易陷到已往的要领论里 ;他对峙定ARR而非DAU方针,也会将产物焦点交给工程师及AI自己,信仰Manus那句 less structure, more intelligence ——当技能自己具有涌现能力时,人的使命不是节制,而是守护那1%的魂灵。 于此次对于话中,冯雷揭示了一个AI创业者的苏醒与坦诚。他不讳言对于年夜模子降本论的质疑—— 去年各人最年夜的过错判定就是信赖模子降价能带来利润空间 ;他也直言当前AI运用公司的困境—— 挪用Claude的公司利润都很低,ARR只是给Claude交的税 ;他甚至略带自嘲地认可 此刻的英文模子效果依然不敷好,必然水平上影响了海外的 GTM 。 这篇对于话记载不仅是对于ListenHub乐成的复盘,更是为当下AI创业者出现出的另外一个参考样本: 01 关在ListenHub产物近况 AI科技评论:ListenHub今朝进展怎样?于市道上各类AI产物都于卷DAU的时辰,你们怎么选择? 冯雷:去年末咱们做到了300万$的ARR,及豆包比拟,它的方针是做中国DAU第一的AI产物,做的是公共买卖。但咱们的方针是做一个赚钱的AI产物。咱们办事的焦点人群可能只占全网用户的1%到3%,就是那些有创造力、愿意付费的创作者。咱们增长了声音克隆、编纂模式等他们需要的功效,如许与年夜厂形成正交瓜葛,没有直接竞争。 AI科技评论:既然是给创作者用的东西,为何选择“AI播客”这个切入点?短视频不是更火吗? 冯雷:播客是一个很神奇的存于。短视频打击了这么多年,听播客的人不仅没少,反而变多了。这申明它内里有一种不成替换的“深度表达”需求。 ListenHub做到了海内第一,焦点特点于在“像人同样天然的表达”。咱们不是于做演出,而是于做沟通。此刻的AI能把讲解视频做患上很是有“人味儿”,这类天然感是用户买单的要害。并且,咱们正于从音频向视频、PPT拓展,流量池会更年夜。 AI科技评论:ListenHub的贸易模式是一最先就确定的吗? 冯雷:是逐渐于创业历程中摸索而来的。最初测验考试感情电台标的目的——AI个性化推送感情故事,撑持谈天并按对于话收费。但该标的目的用户付费意愿有限,东西属性反而更容易变现,是以天然转向迭代,慢慢插手视频、图片、讲解等功效。 02 技能路径与产物体验 AI科技评论:你们此刻重要利用哪些模子?海内外模子利用的差异性于哪里? 冯雷:咱们重要用海外的原生多模态模子。好比把PDF或者Youtube视频直接“洗”成一篇高质量的播客稿件,这需要极强的长窗口及多模态理解力。 咱们也会用到一些海内的模子,好比Qwen、Minimax、字节(豆包)于中文处置惩罚上都不错。但问题出于英文及多语言上。由于咱们要出海,办事海外用户及海外华人,以是必需依靠海外模子。 AI科技评论:产物最重要的技能指标是甚么?是声音还有原度还有是文本流利? 冯雷:分几块:文本方面但愿像真人同样,没有太多 AI味 ;声音方面越天然越好,连结播客轻松的状况;图片方面要给用户充足信息量,同时精致并切合用户要求。 AI科技评论:让AI 没有人味 是经由过程提醒词工程实现的吗? 冯雷:总体是一套尺度的 上下文工程 。前置处置惩罚包括各类输入(YouTube、PDF等),基在解说场景收拾焦点信息,然后根据播客场景处置惩罚。分两步:一是搭架构(像建房搭布局),二是修饰表达(像装修及外墙),终极形成好内容:第一,要有信息量、有干货常识性;第二,表达要吸惹人,能让人听完(好比3分钟完播率),内容再好没人听也不行;第三,要有内涵逻辑,让人听完能转变举动。对于创作者来讲,还有需要节拍、韵律,让粉丝听完想听下一个,这三者要联合。 03 贸易模式与创业思索 AI科技评论:此刻市场上有做“套壳”集成的(如Manus),也有自研模子的,这两种模式怎么看? 冯雷:假如钱充足,还有是会训模子。模子公司寻求更高的上限,好比Coding是个年夜市场,只有本身训模子,于年夜范围用户下利润率才算患上过来。运用公司挪用API(如Claude)实在很难有高利润,年夜部门收入都交给模子厂商了(像交税同样)。 AI科技评论:既然模子成本这么高,前两年说的“模子降价”好像没有给运用公司带来尤其年夜的成本空间? 冯雷:这多是去年各人最年夜的过错判定。 降价发生于模子能力达到阈值以前,那时辰模子没那末有效,只能靠降价扩张,或者者像OpenAI如许寻求超高速笼罩率。但一旦冲破阈值(如google的图片模子,一块钱一张图,很贵,不降价都求过于供),顶级模子就酿成了商品。 AI科技评论:以是此刻做运用一定烧钱? 冯雷:会烧钱,但要合理地烧。不克不及像互联网时代那样免费换范围。AI时代没有收集效应,必需成立康健的经济模子。 AI科技评论:公司今朝融资进展怎样?资金可支撑多久? 冯雷:正于推进新一轮融资,上一轮天涯投完以后估值到达约2000万美元。Q4 ARR增至300万美元,本轮按5000万美元估值举行融资,年末方针估值1亿美元。 当前资金可支撑两年以上。下一轮融资完成后可支撑五年。 AI科技评论:创业公司资金有限,怎样节制成本? 冯雷:重要成本于Token上。咱们设定例则:任何创业项目初始预算为1000美元Token用度。若上线一天内讧尽,申明项目有潜力,公司追加投资;若项目走红但成本可控,也不会造成丧失。以预算作为约束机制,焦点方针是ARR。 该机制自去年10月 使命酒馆 鼎新后实施。使命公然发布,成员自立认领,自力完成从开发到验证的全流程,预算内API用度实报实销。 但测验考试也需要主线及标的目的。咱们的主线是帮忙人表达——经由过程多模态技能加强表达能力。技能与人文联合,方针人群明确(创作者、学生、西席),于此规模内可自由测验考试,但需防止偏离焦点(如短剧属在演出而非表达,不于规模内)。 04 AI时代的产物要领论 AI科技评论:假如中厂、年夜厂把TPMF做患上很好,纯做PMF的公司会遭到打击吗? 冯雷:训模子的公司遍及开放API,因其自有场景不足,需要用数据连续优化模子。模子公司与咱们互助时也会协助微调模子,方针一样是晋升模子能力。是以于这一层面,两边好处一致——场景上各取所需,ROI差别,但都但愿用数据让模子更强。若模子公司真能笼罩所有场景,便不会开放API。 AI科技评论:AI时代做产物,与已往寻觅PMF有何差别? 冯雷:彻底差别。已往需求与技能相对于确定,产物只需找到毗连点,固化workflow,发明盈利路径后迅速范围化,借助收集效应扩张。 AI时代则相反:用户场景与模子练习者的预设往往纷歧致,是以产物、运营、增加都没法先设定明确方针。例如马卡龙早期专注写作,但模子能力未达预期,标的目的过错只能抛却。 逻辑是颠倒的:先构建通用技能,投入市场验证,发明匹配场景(如PPT高频且有价值),再针对于性完美工程。这种似在 拿锤子找钉子 ,虽反知识,但通用技能确能找到适配场景。是以咱们偏向招募3年之内经验的产物司理,资深者反而易受旧有要领论束厄局促。 AI科技评论:于MiniMax时的产物思绪与此刻一致吗? 冯雷:其时尚处Chatbot初期,产物方针是办事模子迭代——获取数据、构建飞轮、晋升模子能力,不存眷产物数据或者营收,只寻求技能上限。 当前情况对于产物司理挑战更年夜:技能变量不禁产物主导,是以需摒弃 ego。咱们公司工程师职位地方很高,拥有充实决议计划权。我不会以15年产物经验自居举行引导,而是聚焦方针设定。方针选择至关主要——DAU方针会致使团队动作变形,ARR 方针于前两年都更有用,因其倒传神实增加与付费转化。 咱们正造就工程师的端到端能力:从用户需求验证(工程师直接介入用户社群)、贸易模式设计到产物上架,全流程介入。将产物司理造就玉成栈成本太高,而将工程师造就成具有产物决议计划能力的全栈人材更具性价比,这是咱们的焦点要领论。 AI科技评论:公司当前主线是甚么?是否会涉够数字人及陪伴类产物? 冯雷:数字人及陪伴类暂不触及。完成现有表达类产物后,咱们认为智能表达已经较为成熟。持久方针是构建Agent——素质上是模仿完备的人。除了表达外,还有需具有思索能力、用意理解能力及履行能力。表达能力已经夯实,现正推进完备Agent的研发。 内部从去年8月最先就已经经于开发一款语音交互驱动的桌面 Personal Agent产物,撑持语音对于话,持久影象,节制电脑,利用收集。咱们将 ListenHub 里堆集的真人感的表达理念及技能堆集注入到全新的 Agent产物中,力求打造出第一个具备真人感的 Agent。 今朝该产物正于紧张的内测中,最早于春节后会跟各人晤面。(本文作者持久存眷AI运用以和创业者故事,接待加微信Who123start畅聊切磋) 雷峰网原创文章,未经授权禁止转载。详情见转载须知。
ListenHub开创人 冯雷