OpenAI最新模型——GPT-4o mini,已在微软Azure OpenAI同步上新!更快更便宜!

OpenAI推出的GPT-4o mini,以其高效成本和快速交付能力,助力用户打造卓越的应用程序。该产品在"大规模多任务语言理解"(MMLU)测试中,以82%的得分率显著超越了GPT-3.5 Turbo的70%,同时在成本上实现了超过60%的降低。GPT-4o mini不仅扩展了128K的上下文窗口,还融入了GPT-4o的多语言优势,为全球用户提供了更高质量的语言支持。

微软在Azure AI(国际版)上同步发布了GPT-4o mini,以卓越的速度支持文本处理功能,图像、音频和视频处理功能也将在近期推出。用户可以在Azure OpenAI Studio(国际版)Playground中免费体验这一服务。

------------------------------------------------------------------------------------------------

很多会员反馈想搭建自己的中转平台,如果你用户多可以考虑,如果大部分就自己在玩还是不建议折腾!原因一申请N次都不一定通过(折腾了几个月放弃时才通过),要使用还是得在官方申请靠谱,原因二微软件针对区域国家进行了配额限制,得选择美国、瑞典等区域建立多个渠道分发,总体来说还是折腾麻烦,当然自己也可一试验证该说法。看了下微软官方的文档实际上目前GPT-4o mini API还未开放,查看了所有区域也未发现该模型。

当然我们的全模型平台对接官方的gpt-4o-mini 模型已正常上线使用 https://api.cxhao.com

企业在国内如何合规、稳定使用ChatGPT?

出于合规角度,建议国内企业可以选择微软的Azure OpenAI服务来使用接口。

针对申请通过的企业用户出一篇部署教程,教程适用于部署所有模型供参考

----------------------------------------------------------------------------------------------

微软Azure版OpenAI GPT-4o部署指南

第一步:点击创建资源,如本站mj.cxhao.com采用3个API资源分发,分别选择美国东部、美国东部2、瑞典西部

1722442114-70bef4b61eea6f6

第二步:如果上述图标没有可输入:OpenAI进行搜索

第三步:点击创建:Azure OpenAI

1722442339-484e1f12a31efe8

第四步:创建Open AI填入必要的信息:如区域为美国东部

1722442368-6efe2f038072afb

下一步

1722442427-a3a2714b1a0f2b1

下一步,可为空

1722442460-c607f9b7ca4c49a

到最后一步自动审阅通过点击创建

1722442496-16fb3cdc4f191f6

第五步:订阅

资源组(可以点击下面的按钮新建一个资源组,类似标记的tag)

区域:这个选择比较重要‼️,不同的区域有不同的模型。

比如:

Australia East 有GPT-4、GPT-3.5-Turbo模型,但是没有GPT-4o。East US 有GPT-4o、GPT-3.5-Turbo模型,但是没有GPT-4模型

微软 Azure OpenAI GPT-4o部署指南(国内企业合规稳定使用ChatGPT首选)插图6

第六步:完成资源组创建之后,进行模型部署创建。

在一个资源里面可以创建多个模型部署,每一个模型部署可以设置最大的并发请求数目。(这样就不用担心API访问频次受限啦,用多少可以进行配置)

1722442626-244824af2cbc073

进入后模型部署或者右下方选择进入都可以

1722442694-d9b25410520e16d

第七步:选择部署模型的配置信息:

1722442774-10cafae09e27e01

进入后点击增加部署基本模型

1722442817-34debaca81e1835

选择模型,界面是7月底刚升级过,如果是老界面稍有不同

1722442875-80585cc60aa487a

出现对话模型后可选择模型版本或者默认即可,确定部署

1722442986-36227af271ee3f7

显示GPT-4o具体部署的情况

1722443087-e2a1251613c5156

再返回部署列表表示部署成功!

1722443137-068c1d8bb8fb400

下面要怎么查看API接口呢?

微软提供API网址和密钥,只需要加在各gpt后台即可,返回组即可出现管理密钥选项

1722443725-5f5c06297f49dd9

打开后查看调用的API网址及密钥

1722443814-cc22220f269dee7

 

API接口具体使用方法

1、ChatGPT付费创作系统 https://www.ttbobo.com/6703.html 站点后台AI通道打开,增加KEY时输入网址和上面取到的密钥

1722444003-adef2674b65dc24

AI名称可在后台对应修改为GPT-4o,输出效果感觉比以前使用openAI还快

1722444220-208868353e42b47TBWEB使用方法 https://www.ttbobo.com/6928.html,后台全局模型调用

1722444402-969ced9ac3c20b0

后台模型设置里新增,填入代理网址及密钥即可

1722444497-5a28cd59982364d

CWMP团队版使用方法 体验网址 https://cwmp.cxhao.com/  下载网址https://www.ttbobo.com/6749.html

1722444627-78d7e90a7e19e69

ChatGPT镜像版使用方法同上,其他系统或者二开自行补脑处理

配额和限制参考

以下部分提供适用于 Azure OpenAI 默认配额和限制的快速指南:

限制名称 限制值
每个 Azure 订阅中每个区域的 OpenAI 资源 30
默认 DALL-E 2 配额限制 2 个并发请求
默认 DALL-E 3 配额限制 2 个容量单位(每分钟 6 个请求)
每个请求的最大提示令牌数 每个模型不同。 有关更多信息,请参阅 Azure OpenAI 服务模型
最大微调模型部署 5
每个资源的训练作业总数 100
每个资源同时运行的最大训练作业数 1
排队的最大训练作业数 20
每个资源的最大文件数 30
每个资源的所有文件的总大小 1 GB
最大训练作业时间(如果超过,作业将失败) 720 小时
最大训练作业大小(训练文件中的标记数)×(时期数) 20 亿
每次上传的所有文件的最大大小(数据上的 Azure OpenAI) 16 MB

区域配额限值

模型的默认配额因模型和区域而异。 默认配额限制可能会更改。

型号 区域 每分钟令牌数
gpt-35-turbo 美国东部、美国中南部、欧洲西部、法国中部、英国南部 240 K
gpt-35-turbo 美国中北部、澳大利亚东部、美国东部 2、加拿大东部、日本东部、瑞典中部、瑞士北部 300 K
gpt-35-turbo-16k 美国东部、美国中南部、欧洲西部、法国中部、英国南部 240 K
gpt-35-turbo-16k 美国中北部、澳大利亚东部、美国东部 2、加拿大东部、日本东部、瑞典中部、瑞士北部 300 K
gpt-35-turbo-instruct 美国东部、瑞典中部 240 K
gpt-35-turbo (1106) 澳大利亚东部、加拿大东部、法国中部、印度南部、瑞典中部、英国南部、美国西部 120 K
gpt-4 美国东部、美国中南部、法国中部 20 K
gpt-4 美国中北部、澳大利亚东部、美国东部 2、加拿大东部、日本东部、英国南部、瑞典中部、瑞士北部 40 K
gpt-4-32k 美国东部、美国中南部、法国中部 60 K
gpt-4-32k 美国中北部、澳大利亚东部、美国东部 2、加拿大东部、日本东部、英国南部、瑞典中部、瑞士北部 80 K
gpt-4 (1106-preview)
GPT-4 Turbo
澳大利亚东部、加拿大东部、美国东部 2、法国中部、英国南部、美国西部 80 K
gpt-4 (1106-preview)
GPT-4 Turbo
印度南部、挪威东部、瑞典中部 150 K
gpt-4 (vision-preview)
GPT-4 Turbo with Vision
瑞典中部、瑞士北部、澳大利亚东部、美国西部 10 K
text-embedding-ada-002 美国东部、美国中南部、欧洲西部、法国中部 240 K
text-embedding-ada-002 美国中北部、澳大利亚东部、美国东部 2、加拿大东部、日本东部、英国南部、瑞士北部 350 K
优化模型(babbage-002、davinci-002、gpt-35-turbo-0613) 美国中北部、瑞典中部 50 K
所有其他模型 美国东部、美国中南部、欧洲西部、法国中部 120 K

保持在速率限制范围内的一般最佳做法

若要最大程度地减少与速率上限相关的问题,可以遵循以下方法:

  • 在应用程序中实现重试逻辑
  • 避免工作负载的急剧变化。 逐步增大工作负载。
  • 测试不同负载增加模式。
  • 增加分配给部署的配额。 如有必要,从另一个部署中移动配额。

如何请求增加默认配额和限制

可以通过 Azure AI Studio 的“配额”页面提交配额增加请求。 请注意,由于需求量巨大,配额提高请求正在接受中,将按接收顺序处理。 将优先考虑产生会消耗现有配额分配的流量的客户。如果不满足此条件,你的请求可能会被拒绝。

服务声明: 本网站所有发布的源码、软件和资料均为作者提供或网友推荐收集各大资源网站整理而来,仅供功能验证和学习研究使用,您必须在下载后24小时内删除。不得使用于非法商业用途,不得违反国家法律,否则后果自负!一切关于该资源商业行为与本站无关。如果您喜欢该程序,请支持购买正版源码,得到更好的正版服务。如有侵犯你的版权合法权益,请邮件或QQ:3089659733与我们联系处理删除(邮箱:ynzsy@qq.com),本站将立即更正。