
为什么是听觉系产品
你有没有想过:什么场景下,我们需要通过”听播客“来感受世界?
我回顾一下自己的生活场景,一般是:
-
在旅途中(车上或者开车中) -
做家务中 -
睡觉前
这些场景总结一下就是:当用户与自己独处时,且用户的视觉系统在做无技术含量的常规事务。很明显,随着结婚率下降,未来中国人与自己独处的时间会越来越多,这样看来,用户给播客的时间也会越来越长。(你可以参考电影《her》里的场景,主人公就是因为声音而爱上了他的AI助手)
实际上播客这种形式在北美的流行程度是非常高的,根据报道[1]北美大约有1.4亿播客用户,而北美总人口约6亿。这就意味着每4个人中,有一个人是播客用户。
在国内我查到最新的数据是参考2023年7月与小宇宙COO的访谈报道[2],其中提到当时小宇宙的月活是450万,不及北美的1/3。如果参考目前北美用户占比,中国未来还有望增长3亿的用户群。

如此庞大潜力用户群,对于创作者来说确实具有极强的吸引力。 那么有什么办法能让优质的创作者快速生产播客呢?
其实播客的内容生成本质是一种内容翻译,和静态图文相比, 两人对谈的方式,会更多激发大家去思考。想象你在听老师单独讲课,和听一个老师与一个学生对话式呈现。
ListenHub能做什么
使用下来,ListenHub有两大功能:一是把文本翻译为播客,二是声音克隆,构建个人品牌。
1. 把文本内容转成对谈播客。

用户输入任何文字,或者上传任何图文内容,选中两位主播声音,点击“创作”后等待3分钟可以生成播客了。比如我把之前在极客时间中讲神经网络原理的内容拿出来。两位主播一个负责调起听众的胃口,一个负责回答,这样理解后的内容就会更加深刻。
随后这种对谈形式也激发我以播客作为逐字稿,做出了动画小视频),用3分钟的时间可以把原本静态的图文变为更有趣的载体,这个视频发布在我的小红书小号(产品二妹)上。
[放大观看效果更好]
2. 克隆自己的声音
如果你也想开始经营自己播客,可以使用ListenHub克隆自己声音。不过目前还不支持用户自己克隆,需要把声音文件按照网站上的指示发给后台管理人员。
在录制声音的时候,要想象你是在和一个人录播客,可以有爽朗的笑声,带上语气,这样声音会更自然。 当然,你也可以克隆不同版本的声音,比如可以有激情高扬的脱口秀版本,也可以有沉稳睿智的口播版本。
克隆好之后,你就能在这里看到自己的音色选择了。

然后把平时写的小文章、小笔记发给ListenHub,就可以光速改写为自己的播客啦。 后面我也会有更多的内容以播客、视频的这种方式和大家见面,而ListenHub在这个过程中帮我做了两件事:
-
改写脚本。 -
帮我请了个捧哏的助理主播。
以这种方式,ListenHub百倍速地加快了播客的生产方式。
ListenHub正在快速迭代中
不止如此,在整个体验的一周中,ListenHub迭代了两次。就在写好这篇文章前,橘子又给我们发了他们即将上线的新效果,我听了一下,比之前的声音更加生动,内容也更加有深度,也允许创作者有更多的控制力。然后,过了40分钟,他有发来一条消息“100% 编辑并且简单到颠覆你的想象”,把工具做简单的确是好产品的关键原则。我期待住了,也请大家下周一起拭目以待吧~

好,今天的内容就到这里了,和以往内容不一样,今天的内容没有很长,希望这种简洁能让我保持更高频次地给大家带来AI产品思考。 我们下期再见!
参考
[1]播客行业指南:顶级平台、关键受众统计数据和广告趋势(https://www.emarketer.com/learningcenter/guides/the-podcast-industry-report-statistics/)
[2]专访小宇宙App,播客营销能给品牌带来什么价值?(https://www.digitaling.com/articles/871394.html)

-
Agent的九种设计模式(图解+代码)" data-itemshowtype="0" linktype="text" data-linktype="2">产品经理研读:Agent的九种设计模式(图解+代码)
-
Agent开发者坦白:窘境中前行 -
RAG组合拳:AGI应用走向落地的40%(上篇) -
RAG组合拳:AGI应用走向落地的40%(下篇)--附100M文档资料 -
我在调研了十几个知识库对话产品后整理出来的功能清单 -
用一张图理解所有的AI“聊天”产品(上篇) -
用一张图理解所有的AI Native产品(下篇) -
一文讲清大模型AI应用架构 -
做大模型AI应用一定要了解的成本计算公式 -
当老板问起落地AI解决方案要多少钱,你该如何回答 -
AI应用省钱攻略--降低模型成本的七大策略