“开发一款 APP,要集成十几甚至几十个第三方 SDK,这到底是幸福还是苦恼?”
“市场变化飞快,商机转瞬即逝,我希望有更多时间思考如何走得更远,而不是忙于重复‘造轮子’。”
“无数的接口,筛来筛去的供应商…… 我真的累了。”
类似这样的开发者声音不绝于耳。
简单直接,向来是开发者群体的“刚需”。就像一个不是段子的段子:大家知道程序员最高效的沟通是什么吗?—— 就是不沟通。不要说话,不要解释,不要互相说服,你写的 API 我能看懂,然后调用就可以了。
作为安全、可靠的互联网通信云服务商,融云所有决策的出发点,就是为开发者赋能,把开发者需求放在第一位,持续探索更加简单易用的通信解决方案。
秉持着这样的理念,近日,融云重磅推出 IM+RTC+X “全”通信解决方案,在即时通讯和实时音视频的双核心能力之上,增加 X 元素 —— 通信周边能力的总和,从 0 到 X,完成“一切为了开发者”的战略升级,以全场景、全平台、全服务、全生态、全球化五大维度,全效赋能开发者。
“X”四象限能力图谱解读
“X”对于 PaaS 通信云厂商而言并非核心能力,但对于通信场景的集成往往又至关重要,通常需要开发者自己逐一对接第三方厂商的功能、代码以及价格,会消耗开发者大量的时间成本。
举个例子来说,从通信云厂商的角度看,只要给客户提供了低延时、低成本、高流畅、高品质的通信体验,就已经合格履行了自身的职责;但从开发者的角度看,随着内容监管日趋严谨、行政监管愈发严格,开发者还需要额外再去采购像“审核”这样的能力,以保障自身的业务安全。
而类似这样特殊而又普遍的需求,细分到不同场景里还有很多。它可以是审核,可以是 CDN,可以是推送,可以是白板,可以是翻译,亦可以是美颜、美声等等。
在这样的背景下,融云率先转换视角,应开发者之所需,将大量通信周边能力进行模块化包装,对接和集成到 IM 和 RTC 核心能力之上,让开发者只需简单的勾选和配置,就能够把其直接引入到产品中去。
X 具体包含什么呢?按照开发者分别在客户端和服务端调用 IM 和 RTC 的周边能力,基本可以用四象限的方法去划分和阐释 X 的内涵。
(融云 X 四象限能力图谱)
如图,从正上方逆时针排序,分别为一至四象限。
在第一象限中,当客户端有 IM 需求时,往往也需要表情、文字翻译、红包、地图和语音转文字等通信的周边能力。可以想象,在聊天室或单/群聊场景下,红包、表情等功能都是营造聊天气氛的“高手”,文字翻译、语音转文字功能和地图更是增强交互体验的社交“利器”。
在第二象限中,推送、聊天机器人和图文审核等能力,在服务端多个 IM 场景里必不可少。比如,电商直播场景中,通过 IM 与 AI 的合成技术,聊天机器人可以通过对关键字的识别,发送问题答案,也可以“以假乱真”地提供人声阅读;语聊房场景中,当用户处于离线状态,可利用推送服务来通知用户,唤醒用户,让消息及时送达;所有通信场景中都需要图文审核,这样可以规避运营中的涉政、涉黄、涉暴风险。
在第三象限中,当客户端有 RTC 需求时,美颜、变声、虚拟背景等通信能力在泛娱乐社交、游戏等场景中经常被需要。比如,在线相亲场景中开启“美颜”就能让素人秒变女神;在线 KTV 中应用“变声”功能,能让“大叔”变“萝莉”;在线游戏中,通过虚拟背景,会让队友在团战中“身临其境”。
在第四象限中,当开发者应用 RTC 能力时,服务端的 CDN、白板、SIP 和音视频审核等能力也被广泛需要。比如在线教育的大班课,因较弱的实时互动需求,就可以选择 CDN 方式实现音视频通话,降低成本,提升性价比;在线会议等场景对白板、SIP 功能的需求几乎是刚需,其中 SIP 作为应用层信令控制协议,参与创建、修改和释放一个或多个参与者的会话。
当然,X 的内涵还在应需而变、持续丰富中。理解了“X”的内涵,也就理解了融云此次战略升级的初衷所在:以 IM+RTC+X 的“全”通信解决方案为开发者减负,让开发者在不同场景享受到差异化、便捷化的产品服务体验,助力开发者获得商业成功。
融合,构建「全」通信解决方案
“X”作为通信周边能力并非单独存在,与 IM 和 RTC 融合后,即构成了新一代完整的 IM+RTC+X“全”通信解决方案,涵盖五大维度:全场景、全平台、全服务、全生态和全球化。
全场景:融云支持在线教育、兴趣社交、电商直播、娱乐直播、远程医疗、互动游戏、地产服务、交通出行等全场景的通信需求。针对热门场景,比如语聊房、直播、会议、呼叫等,融云还会抽象出该场景下典型的业务逻辑,隐藏复杂的技术细节,封装提供场景化的 SDK,让开发者开箱即用,快速集成时间缩短至 30 分钟以下。
全平台:融云的全平台支持能力体现在可以满足全技术栈,适配 Electron、Mini Program、Windows、Linux、Flutter、React Native、Unity、uni-app 和 H5 等全平台系统,确保多端、多平台的相互兼容。此外,在智能硬件适配,以及适配所有主流手机厂商推送平台等方面也表现出众。
全服务:融云提供覆盖产品全生命周期的一站式服务,包括选型期的方案咨询&设计服务,部署期的代码审查服务、需求加急服务、精简 SDK 服务,上线运维期的 VIP 售后技术支持服务、通讯质量监控&问题排查服务等,让开发者从选型部署到上线运维,全程放心无忧。
全生态:融云今年首次提出“开发者服务生态”的理念,通过与产业链上下游厂商合作,共同服务开发者。比如,通过与 AWS 等厂商合作,为融云通信链路在国内外开辟多个数据中心和边缘节点;通过与数美公司等合作,丰富了黑产数据库,强化了融云在图文音视的内容审核能力,等等。
全球化:响应中国应用出海趋势,融云持续支持中国的出海开发者,为他们“走出去”提供从底层架构、到安全合规、再到本地化适应的全程技术陪伴,如全球通信网络、全球数据中心、内容安全、隐私与数据合规、多语言支持、文字语音翻译等,与中国开发者共拓全球“蓝海”市场。
(融云“全”通信解决方案)
探索无限,未来已来
未来已来。今日的融云,提供的已不止于产品和服务,还有驱动业界向前发展的行业新理念。融云正引领通信云行业走进下一时代:从提供“标准化”产品,向“根据不同场景需求匹配差异化解决方案”的模式转变。
从 0 到 X,融合致胜。“X”并不是一个确定的概念,它意味着通信的不断延展,更意味着无限可能。
随着融云视角的转换,服务理念的不断升级,基于 IM+RTC+X 的“全”通信解决方案的价值也将被感知得更加清晰。
好文章,需要你的鼓励
OpenAI在最新博客中首次承认,其AI安全防护在长时间对话中可能失效。该公司指出,相比短对话,长对话中的安全训练机制可能会退化,用户更容易通过改变措辞或分散话题来绕过检测。这一问题不仅影响OpenAI,也是所有大语言模型面临的技术挑战。目前OpenAI正在研究加强长对话中的安全防护措施。
北航团队推出VoxHammer技术,实现3D模型的精确局部编辑,如同3D版Photoshop。该方法直接在3D空间操作,通过逆向追踪和特征替换确保编辑精度,在保持未修改区域完全一致的同时实现高质量局部修改。研究还创建了Edit3D-Bench评估数据集,为3D编辑领域建立新标准,展现出在游戏开发、影视制作等领域的巨大应用潜力。
谷歌宣布计划到2026年底在弗吉尼亚州投资90亿美元,重点发展云计算和AI基础设施。投资包括在里士满南部切斯特菲尔德县建设新数据中心,扩建现有设施,并为当地居民提供教育和职业发展项目。弗吉尼亚州长表示这项投资是对该州AI经济领导地位的有力认可。此次投资是谷歌北美扩张战略的一部分。
宾夕法尼亚大学研究团队开发出PIXIE系统,这是首个能够仅通过视觉就快速准确预测三维物体完整物理属性的AI系统。该技术将传统需要数小时的物理参数预测缩短至2秒,准确率提升高达4.39倍,并能零样本泛化到真实场景。研究团队还构建了包含1624个标注物体的PIXIEVERSE数据集,为相关技术发展奠定了重要基础,在游戏开发、机器人控制等领域具有广阔应用前景。