首页 科技快讯 提升音频制作效率和效果,「倒映有声科技」推出有声读物制作平台“书映”

提升音频制作效率和效果,「倒映有声科技」推出有声读物制作平台“书映”

来源:晰数塔互联网快讯 时间:2020年09月12日 09:01

声音是一个大市场,看几个数据就能知道——

2019年,Strategy Analytics报告称,智能音箱全球出货量达到1.469亿台;同年10月,喜马拉雅官方透露,其激活用户突破6亿、付费会员突破400万;而早在2013年,苹果就曾公布Podcast全球订阅用户已超10亿。

除了直接录制音频以外,很多内容提供商都在采用TTS(Text To Speech)等技术把文本转化为语音。但传统的TTS技术有明显的机器音,用户长时间收听,容易疲倦。同时,传统配音社生产速度太慢,跟不上文字作品的更新速度,导致有大量文字作品积压,有待转为有声读物。

市场需求和痛点的存在,让一些创业公司嗅到了机会。

36氪近日采访的杭州倒映有声科技有限公司(以下简称“倒映有声”)是一个成立于2019年3月的音频内容创作平台,打算从“有声读物制作”这一细分领域,切入音频市场。

该公司创始人兼CEO肖朔硕士毕业于北京航空航天大学云计算专业,曾在猎户星空、百度任职。在百度的语音技术部、产品创新实验室任职期间,他曾带领100人的TTS、图像和数据团队;联合创始人兼CTO李骁是帝国理工大学人工智能专业硕士,曾任职于百度、滴滴、猎户星空等公司,在百度期间曾与团队实现国内首个waveRNN落地。

目前,倒映有声主要通过自研语音技术,搭建内容创作服务平台,为版权方和创作者解决音频内容制作产能低、成本高、收益少的问题。该公司称,其音频制作服务可使综合效率提升数十倍,效果最高可超过95%的真人录制水平。

具体来说,倒映有声主要提供两大服务:1.音频制作自助服务:为版权方和文学创作者,提供有声音频的全/半自动的多种制作服务,涵盖“画本-录制-剪辑”全流程云端制作,包括中英文、单人播、多人播等,按音频内容量收费;2. 承包制作和运营服务:从版权方获取文学版权,承包制作,并进行推广运营,塑造爆款IP。目前,倒映有声已经与大约5家版权方合作,上线了10多部作品,收入来源于用户付费订阅、与版权方的收入分成。

目前,倒映科技已经上线了有声读物制作平台“书映”。用户可在平台上自助制作纯自动化的有声书、人机结合的多人有声书。

近年来,亚马逊、苹果、谷歌、百度、小米等互联网巨头纷纷布局智能音箱。肖朔表示,这些公司主要是用TTS等技术做简单的语音播报,用于智能音箱等人机交互设备,目标是让用户听懂。但倒映有声做的是有声读物,对语音所传达的情感多样性要求较高,需要采用情绪迁移、音色迁移等技术,按照文字语义,模拟人的情绪和音色,实时合成与真人相似的声音。

谈及市场规模,肖朔算了这样一笔账:2019年,中国网络文学市场约200亿人民币,有声书市场规模不低于文字作品市场的50%,算作100亿人民币。同样在2019年,中国知识付费市场规模达到278.0亿元,预计2020年将突破392亿元。如果有声读物的市场渗透率为20%,那市场规模可达78亿人民币。这样算下来,国内每年市场规模可达178亿人民币。

再看国外市场,海外音频读物订阅用户大概有10亿-20亿人,按人均年消费50美金计算,海外有声读物市场规模在500亿-1000亿美金。

未来3年,倒映有声的目标是成为一家面向全球市场的有声读物制作和发行商,并构建娱乐性的声音创作社区。

肖朔告诉36氪,海外音频产品付费习惯好,终端销售价格几乎是中国的7-10倍,而欧美地区配音的人力成本是中国的10倍,TTS技术相比国内并未有绝对优势。如果倒映有声能出海,将有很大的成本优势。此外,倒映有声也希望为C端研发更有趣的创作工具,并提升声音内容的互动性,比如利用小样本克隆技术,让用户参与书籍录制;抽离作品中的IP音色,建立虚拟IP人物,以游戏形式和用户互动。

谈及挑战和风险,肖朔告诉36氪,第一,现有的TTS等技术的成熟度还有待提升,和真人仍有差距,难以做到夸张多变的演绎,无法全面代替真人录制,导致短期内无法进入更专精的场景,需要不断持续研发,并用场景积累的资源和数据来迭代技术;

“从技术的终局来看,肯定还会有大概5%~10%的内容需要真人来进行演绎,因为艺术创作的部分,技术是代替不了的。”肖朔提到。

第二,模式重运营,运营可以带来更多的持续性收入提升,但超出目前团队能力,需要考虑如何提升运营效率;第三,国内上下游过于集中,版权和渠道话语权过重,压缩了收入空间,需要拓展更多的场景和客户群体;第四,国内外AI巨头公司众多,单纯比拼技术、忽略场景深度,难以为继。因此,倒映有声计划首先在有声读物这个细分领域做深做专。

倒映有声曾获得数百万人民币的天使轮融资,目前正在进行800万人民币的Pre-A轮融资。

——————

我是36氪记者王艺瑾,业务交流可添加微信catherineyijin,请备注公司+姓名+职务+来意。

相关推荐

提升音频制作效率和效果,「倒映有声科技」推出有声读物制作平台“书映”
输出语音合成技术,「深声科技」已在有声读物等领域完成商业化落地
新科技创业2019 | 研发神经网络合成加速技术降低60%成本,「激浊扬清」有声读物合成方向加速商业化
融资合伙人入围项目 | 研发新型合成技术,「随身听」瞄准有声读物的语音合成
喜马拉雅与26家出版社达成合作 共同开发有声出版物
融资后估值20亿的懒人听书,能带火有声书吗?
36氪首发 | 音频平台「懒人听书」完成新一轮亿元级融资,行业头部效应显著
在线音乐免费用户规模扩张遇瓶颈,长音频新战略下腾讯音乐有怎样的未来?
字节上线「番茄畅听」App,入局长音频
最前线|阅文腾讯联手,要把更多网文IP改成长音频

网址: 提升音频制作效率和效果,「倒映有声科技」推出有声读物制作平台“书映” http://www.xishuta.com/newsview30825.html

所属分类:互联网创业

推荐科技快讯