AI降本新选择，火山引擎第三代云服务器全面升级！

投稿
APP
微信扫一扫获取更多

AI降本新选择，火山引擎第三代云服务器全面升级！

莫婕妤

2024-06-26 00:00:00

图灵汇官网

新科技浪潮下的产业革新与算力升级

随着人工智能（AI）技术的迅猛发展与应用场景的不断扩展，各行各业对高效、低成本算力的需求日益增长，旨在推动业务创新与增长，实现降本增效。在此背景下，火山引擎推出了全面升级的第三代云服务器，旨在通过其先进的全栈自研技术与软硬一体的DPU2.0架构，以及自研虚拟化全卸载技术，实现算力零损耗，从而提供超卓的算力、网络性能与更强的存储I/O能力。

算力全面升级，AI降本新选择

面对AI技术的不断演进与应用场景的多样化，企业对高性能、性价比高的算力需求显著增强。火山引擎第三代通用型实例g3i应运而生，其性能较前代产品提升高达122%，在高性能计算、数据库部署、Web应用及音视频处理等领域展现出卓越性能，尤其在AI推理领域实现技术突破，每个内核均集成AMX AI加速功能，支持80亿参数模型的高效推理，确保用户享受到即时流畅的交互体验。

例如，在文生图生成式AI应用中，使用g3i实例进行SDXL-Turbo模型推理，可实现秒级生成图像；在对话式文本生成场景中，通过80亿参数量大语言模型的推理，g3i实例能将首包时延控制在1秒以内。同时，结合字节跳动内部潮汐资源并池与Spot抢购模式，g3i实例的推理成本较A10 GPU实例最高可降低77%，为企业大幅降低成本。

单核性能提升25%，应对计算密集型挑战

对于科学计算、工程计算等高负载业务场景，火山引擎推出的高主频实例hfr3i提供了3.4GHz的主频与4.0GHz的全核睿频，单核性能较前代提升25%，在算力密集场景下，应用性能最高提升30%，单vCPU算力性价比提高15%。这使得hfr3i实例能够满足EDA、工业仿真、MMORPG游戏、关系数据库部署等场景的高性能需求。

以EDA软件为例，通过hfr3i实例的高单核性能，企业可以在相同的实例规格下运行更多EDA作业，有效降低业务部署成本，同时缩短设计任务的耗时，提升芯片设计的全流程效率。

弹性预约实例，成本优化27%

火山引擎致力于通过规模化优势提供更具普惠性的算力资源。依托内部大规模算力集群，通过与内部业务进行资源池化、混合部署及硬件机型统一等技术手段，构建了丰富弹性资源库，并推出业界首创的“弹性预约实例”售卖模式。这种模式允许用户免费提前预约资源，到点自动交付，相比传统按量计费，成本优化达27%以上。同时，火山引擎公有云拥有百万级服务器、亿核CPU规模，能在高并发场景下提供澎湃算力，满足多种场景需求。

弹性预约实例结合了按量计费的灵活性与接近包月计费的高性价比，特别适合有预见性的弹性资源使用场景，如游戏、在线教育、财务SaaS、电商大促及渲染等。