| GPT | GPT | Anthropic | 阿里云 | 阿里云 | DeepSeek | 豆包 | |
|---|---|---|---|---|---|---|---|
| GPT-4.1 | GPT-4o | Gemini 2.5 Pro | Claude Opus 4 | qwen-max | qwen-omni-turbo | deepseek-r1 | doubao-1.5-pro-256k |
| GPT-4.1 mini | GPT-4o mini | Gemini 2.5 Flash | Claude Sonnet 4 | qwen-plus | qvq-max | deepseek-v3 | doubao-seed-1.6-thinking |
| GPT-4.1 nano | GPT-image-1 | Gemini 2.0 Flash | Claude Haiku 3.5 | qwen-turbo | qvq-plus | deepseek-v3.1-250821 | doubao-seed-1.6-flash |
| o3 | Dall-E-3 | Gemini 2.0 Flash- Lite | Claude Opus 3 | qwen-long | qwen-v1-max | deepseek-r1-0528 | doubao-1.5-thinking -pro |
| o4-mini | whisper-1 | gemini-2.5-flash-image - preview | Claude Sonnet 3.7 | qwq-plus | qwen-v1-plus | DeepSeek-R1-Distill -Llama-70B | doubao-seed-1.6 |
| GPT-4-turbo | gpt-4o-transcribe | Imagen 3 | Claude Haiku 3 | qwen3-32b | qwen-v1-ocr | DeepSeek-R1-Distill -Qwen - 32B | doubao-Seedream-3.0 -t2i |
| GPT-5 | gpt-4o-mini-transcribe | qwen3-235b-a22b | wan2.1-t2i-turbo | ||||
| GPT-5 mini | tts-1 | wan2.1-t2i-plus | |||||
| GPT-5 nano | tts-1-hd | qwen-image | |||||
| gpt-4o-mini-tts | qwen-image-edit |
通过统一API签名,企业终端可灵活对接第三方、平台预置及私有模型。借助平台,企业人员可统一管理多家AI服务商密钥,按需设置不同token有效期。
支持对输入提示词进行敏感内容检测,防范数据泄露风险。对输入、输出内容,还可开展多维度违规检测,全面保障AI应用的安全与合规。
自主创建通道,灵活配置负载均衡、请求重试回退、速率限制等策略,在AI服务异常时,能够无缝切换,确保大模型服务稳定,避免资源滥用。
与边缘函数无缝衔接,支持客户自定义AI代码,实现定制逻辑。预集成的 RAG、联网搜索、提示工程等组件,可供AI网关灵活调用,扩展AI能力。
开启缓存管理,用户请求优先命中 AI 缓存,显著降低回服务商的Tokens消耗和时延。平台默认开启全球CDN加速,优化AI全链路性能。
控制台实时展示请求数、Tokens数、缓存数、错误数等关键指标,支持按照服务商、模型等维度过滤,帮助企业人员了解AI服务性能和成本。
通过统一的API接口,快速对接文心一言、DeepSeek、OpenAI等国内外100+主流大模型,无需频繁改动代码,大幅提升集成效率。
通过智能路由、请求重试、模型回退等策略,保障AI服务高可用。借助AI缓存和精细的限流措施,减少大模型调用次数,有效控制成本。
依托全球CDN加速网络,用户轻松直达就近AI网关,实现卓越性能提升。同时免费提供跨国高速传输,服务稳定,保障业务全球畅通无阻。
融合 CDN边缘安全防护体系,按需开启内容安全审核,包括敏感词检测和违规检测等,防范数据泄露风险,保障AI调用安全与合规。
提供详细日志和数据分析报表,实时监控AI应用的使用情况与性能等指标,帮助开发者洞察应用状态,优化AI大模型服务成本与效果。
无缝对接边缘函数,满足个性化定制需求。边缘AI网关与多种应用组件深度集成,开箱即用,大幅缩短开发周期,加速AI应用落地。