• 产品
  • 方案
  • 客户
  • 服务
  • 活动
  • 关于
App 文档 备案
  • 退出
  • 快速注册
  • 登录控制台
快杰云主机 全球网络加速 UCloudStack 产品定价 产品动态
  • 基础云计算
    云主机基础网络
  • 数据库与大数据
    Hadoop数据仓库
  • 人工智能
    大模型产品
  • 安全、开发与运维
    DDoS防护堡垒机
  • 混合云与私有云
    私有云混合云
  • 云通信与企业应用
    短信服务域名服务
计算
  • 云主机 UHost
  • 裸金属云主机 UPHost
  • GPU云主机 UHost
  • GPU裸金属云主机 UPHost
  • 私有专区 UDSet
  • 轻量应用云主机 ULightHost
  • 容器云 UK8S
云上网络
  • 私有网络 UVPC
  • 负载均衡 ULB
  • 云解析 UDNS
混合组网
  • 云联网 UGN
  • 智联 UWAN
  • VPN网关 IPSecVPN
  • 高速通道 UDPN
接入网
  • 外网弹性IP EIP
  • 共享流量包 UTP
云分发
  • 云分发 UCDN
存储
  • 云硬盘 UDisk
  • 文件存储 UFS
  • 文件存储 UPFS
  • 对象存储 US3
  • 磁盘快照服务 USnap
  • 数据方舟 UDataArk
网络加速
  • 全球动态加速 PathX
  • 应用仓库加速 UAAA
视频服务
  • 云直播 ULive
边缘计算
  • 边缘计算虚拟机 UEC-VM
数据库
  • 云数据库 UDB MySQL
  • 云数据库 UDB MongoDB
  • 云数据库 UDB PostgreSQL
  • 云数据库 UDB SQL Server
  • 云内存 UMem Memcache
  • 云内存 UMem Redis
  • 分布式NewSQL数据库 TiDB
大数据与中间件
  • 托管Hadoop集群 UHadoop
  • ES服务 ElasticSearch
  • Kafka消息队列 UKafka
数据仓库
  • 数据仓库 UDW Greenplum
  • 数据仓库 UDW Clickhouse
通用人工智能
  • AI图像处理平台 PICPIK.AI
  • 模型服务平台 UModelVerse
      安全防护
      • WEB应用防火墙 UWAF
      • DDoS攻击防护 UDDoS
      • 主机入侵检测 UHIDS
      安全合规
      • 堡垒机 UAuditHost
      • 等保咨询 UDBCP
      • 数据安全解决方案 UDSS
      • 安全屋 SafeHouse
      监控与运维
      • 云监控 CloudWatch
      • 资源监控 UMon
      • 网络拨测 UNDT
      多云与迁移
      • 数据传输服务 UDTS
      混合云
      • 混合云 UHybrid
      • 金翼专区 UXZONE
      • 多云管理平台 UCMP
      • 天镜·智能告警 SkyM Alert
      私有云
      • 私有云 UCloudStack
      • 智能大数据平台专业版 USDP
      • 超融合一体机 Utrion
      • 统一存储 UCloudStor
      • 信创云 UXC
      云通信
      • 语音消息服务 UVMS
      • 短信服务 USMS
      • 视频短信 ISMS
      • 短链工具 USLK
      • 企业名片 UCNAM
      企业应用
      • 域名服务 UDNR
      • SSL证书管理 USSL
      • 行业解决方案
        医疗 教育行业
      • 通用解决方案
        云备份 高可用
      零售
      大数据及BI | 线上线下一体化营销 | 云原生  
      政府
      政务云 | 政府数据开放 | 高性能计算 | 智慧农业 | 智慧养老
      出海
      游戏出海业务 | 电商出海业务 | 区块链技术
      金融
      信创云 | 数据流通 | 云原生 | 视频云 | 安全
      教育
      云网融合 | 智慧校园 | 教学实训平台 | 高性能计算
      工业
      工业数据采集应用 | 数字孪生 | 视频云 | 智慧运维
      智慧物业与园区
      智慧社区 | 智慧养老 | 智慧楼宇 | 智慧物业 | 物联网
      智能汽车视频云
      抗弱网,低延迟 | 全面数据安全保障 | 多种互动模式
      云游戏
      大作随玩 | 电视盒子 | 直播客户 | 游戏内容
      智慧农业
      数字化生产管理 | 物联网LoRa通讯技术 | 土壤质量标准化技术
      远程桌面云
      医联体 | 生物制药
      智慧楼宇
      考勤管理 | 人脸门禁 | 智能迎宾 | 访客管理
      智慧能源
      物联网平台 | 物联网边缘网关 | 用能分析 | 能效诊断
      医疗
      医院信息化云基石 | 医院混合云容灾备份 | 区域医疗健康云
      人工智能
      图像识别服务 | OCR文字识别 | 视频处理
      海量计算
      图片处理 | 基因测序 | 视频转码 | 科学计算
      安全
      网站防护 | 游戏防护 | 主机防护 | 内部运维风险管控
      高可用
      具备高可用架构和冗余能力的业务 | 具有较高可靠性、业务连续性的业务
      大数据
      开箱即用 | 智能运维 | 一站式服务 | 资源独享
      云备份
      云灾备场景 | 云归档场景
      物联网
      智能设备 | 共享租赁 | 智能制造 | 智慧物业
      云智能存储网关
      医疗PACS影像上云 | 视频安防文件上云
      视频云
      长短视频点播 | 娱乐/电商直播 | 互动课堂
      智慧运维
      祼机纳管 | PingMesh | 告警治理 | 多云纳管
      边缘云
      容器虚机共存 | 多级地域管理 | 边缘自治 | 开放接口
      混合云
      互联网金融行业 | 银行业金融机构 | 证券行业
      • 加入合作伙伴体系
        UCloud秉持开放、合作、共赢的态度,赋能伙伴为用户提供更加优质的服务。
      教育
      在线教育 | 培训机构 | 教务机构 | 中小学
      金融
      银行 | 证券 | 互联网金融
      游戏
      手游 | 端游 | 游戏全球服
      出海
      电商 | 游戏
      政务企业
      政务 | 传统企业 | 媒体
      新零售
      电商 | 门店 | 商超 | 品牌商
      视频直播
      娱乐直播 | 赛事直播 | 课堂直播 | 短视频
      医疗健康
      传统医院 | 基层医疗机构 | 在线医疗
      AI+IoT
      AI | 物联网 | 车联网 | 智能制造
      技术生态
      • 优云精选
      渠道伙伴
      • 代理商管理
      • 促销活动专区
        春季出海大促
      • Think in Cloud
        2020 2019 2018
      • 更多专题
        “快杰”云主机
      促销活动专区
      • 春季出海大促

      • 快杰主机特惠

      • 香港特惠专区

      • 游戏联机服务器

      • 跨境出海特惠

      • 全球专线服务

      • GPU特惠

      • CDN特惠

      • 短信特惠促销

      • 私有云

      • 托管/混合云

      • 裸金属服务器

      • 轻量专题活动

      • 推荐有礼

      Think in Cloud
      • TIC 2020

      • TIC 2019

      • TIC 2018 12月

      • TIC 2018 5月

      • TIC 2015

      更多专题
      • 快杰 SERIES

      • ARM云主机

      • 快杰内存型

      • 快杰共享型

      • 乌兰察布促销

      • AMD云主机

      • “快杰”云主机

      • 快杰O SR

      关于UCloud
      • 公司介绍
      • 联系我们
      • 加入我们
      • 开源工作
      新闻资讯
      • 最新动态
      • 安全资讯
      • 产品动态
      投资者关系
      • 实时行情(沪市)
      • 公司公告(沪市)
      • 联系方式(董事会办公室)
      保障体系
      • 安全中心
      • 数据保障(GDPR)
      服务体系
      • 开发者资源
      • 技术支持
      • 运维服务
      • 服务支持计划
      • 专家服务
      • 等保合规服务
      • 备案服务
      社区与培训
      • 社区Beta版
      • 登录
      • 控制台
      产品目录
      计算
      • 云主机 UHost
      • 裸金属云主机 UPHost
      • GPU云主机 UHost
      • GPU裸金属云主机 UPHost
      • 私有专区 UDSet
      • 轻量应用云主机 ULightHost
      • 容器云 UK8S
          存储
          • 云硬盘 UDisk
          • 文件存储 UFS
          • 文件存储 UPFS
          • 对象存储 US3
          • 磁盘快照服务 USnap
          • 数据方舟 UDataArk
          网络加速
          • 全球动态加速 PathX
          • 应用仓库加速 UAAA
          云分发
          • 云分发 UCDN
          视频服务
          • 云直播 ULive
          • 实时音视频 URTC
          边缘计算
          • 边缘计算虚拟机 UEC-VM
          数据库
          • 云数据库 UDB MySQL
          • 云数据库 UDB MongoDB
          • 云数据库 UDB PostgreSQL
          • 云数据库 UDB SQL Server
          • 云内存 UMem Memcache
          • 云内存 UMem Redis
          • 分布式NewSQL数据库 TiDB
          大数据与中间件
          • 托管Hadoop集群 UHadoop
          • ES服务 ElasticSearch
          • Kafka消息队列 UKafka
          数据仓库
          • 数据仓库 UDW Greenplum
          • 数据仓库 UDW Clickhouse
          安全防护
          • WEB应用防火墙 UWAF
          • DDoS攻击防护 UDDoS
          • 主机入侵检测 UHIDS
          安全合规
          • 堡垒机 UAuditHost
          • 等保咨询 UDBCP
          • 数据安全解决方案 UDSS
          • 安全屋 SafeHouse
          监控与运维
          • 云监控 CloudWatch
          • 资源监控 UMon
          • 网络拨测 UNDT
          多云与迁移
          • 数据传输服务 UDTS
          混合云
          • 混合云 UHybrid
          • 金翼专区 UXZONE
          • 多云管理平台 UCMP
          • 天镜·智能告警 SkyM Alert
          私有云
          • 私有云 UCloudStack
          • 智能大数据平台专业版 USDP
          • 超融合一体机 Utrion
          • 统一存储 UCloudStor
          • 信创云 UXC
          云通信
          • 语音消息服务 UVMS
          • 短信服务 USMS
          • 视频短信 ISMS
          • 短链工具 USLK
          • 企业名片 UCNAM
          企业应用
          • 域名服务 UDNR
          • SSL证书管理 USSL
          通用人工智能
          • AI图像处理平台 PICPIK.AI
          • 模型服务平台 UModelVerse
          解决方案
          行业类
          • 行业类-零售
          • 行业类-政府
          • 行业类-金融
          • 行业类-出海
          • 行业类-医疗
          • 行业类-教育
          • 行业类-工业
          • 行业类-智慧楼宇
          • 行业类-疫情综合管理系统
          • 行业类-远程桌面
          • 行业类-云游戏
          • 行业类-智慧农业
          • 行业类-智慧物业与园区
          • 行业类-智慧能源
          • 行业类-智能汽车视频云
          • 行业类-新零售
          通用类
          • 通用类-人工智能
          • 通用类-安全
          • 通用类-海量计算
          • 通用类-高可用
          • 通用类-云备份
          • 通用类-物联网
          • 通用类-云智能存储网关
          • 通用类-大数据
          • 通用类-视频云
          • 通用类-智慧运维
          • 通用类-边缘云
          • 通用类-混合云
          文档中心
          客户案例
          教育
          金融
          游戏
          移动社交
          政务企业
          新零售
          视频直播
          医疗健康
          AI+IoT
          更多案例
          关于我们
          公司介绍
          新闻资讯
          最新资讯
          U刻 博客
          开源工作
          服务
          开发者资源
          安全中心
          数据保障(GDPR)
          技术支持
          运维服务
          等保合规服务
          备案服务
          公告
          新闻动态 超对称联合复旦大学发布并开源120亿参数语言模型BBT-2 UCloud提供算力和开源支持

          超对称联合复旦大学发布并开源120亿参数语言模型BBT-2 UCloud提供算力和开源支持

          文 / UCloud 公关部

          2023-04-25

          近日,超对称与UCloud合作,将公司推出的3个大模型开源到UCloud官网,以“大模型+大算力“的方式,共同推进AICG创新应用。

          2022年5月超对称技术公司发布大语言模型Big Bang Transformer【乾元】的第一版BBT-1,10亿参数预训练语言模型,在中文金融语料上训练而成,发布之后即获得经济金融领域客户热烈反馈,作为大模型底座已经为多家中国和海外机构提供服务。

          近期,超对称公司再推出BBT-2,这是一个基于120亿参数的通用大语言模型,并在BBT-2的基础上,训练出代码、金融、文生图等专业模型。

          超对称技术公司将发布基于BBT-2的系列模型:

          •

          BBT-2-12B-Text:120亿参数的中文通用语言模型

          •

          BBT-2.5-13B-Text: 130亿参数的中文+英文双语基础模型

          •

          BBT-2-12B-TC-001-SFT 经过指令微调的代码模型,可以进行对话

          •

          BBT-2-12B-TF-001 在120亿模型上训练的金融模型,解决金融领域任务

          •

          BBT-2-12B-Fig:文生图模型

          •

          BBT-2-12B-Science 科学论文模型

          通过与UCloud在算力和开源方面的合作,超对称还将3个大模型开源到官网、github和UCloud,后续用户可直接在UCloud官方平台通过GPU云主机的行业镜像或算力平台直接开箱使用这些模型:

          

          BBT-1-0.2B:2亿参数金融模型,包括三个不同预训练方式进行训练的模型, 训了600亿Tokens:

          (1)BBT-1-0.2B-001:2亿参数,金融模型,T5 Decoder+Encoder架构

          (2)BBT-1-0.2B-002: 2亿参数,金融模型,T5+GPT

          (3)BBT-1-0.2B-003: 2亿参数,金融模型,T5+UL2

          

          BBT-1-1B:10亿参数金融模型,T5 Encoder+Decoder架构,使用金融中文语料库1000亿tokens进行预训练,包含社交媒体,财经新闻,券商研报,公司公告财报等数据

          

          BBT-2-12B-Text:120亿参数基础模型,GPT Decoder-Only 架构,未经指令微调,完成2000亿token预训练,模型性能还有较大提升空间,开发者可在通用模型上继续训练或进行下游任务微调

          

          BBT-2.5-13B-Text: 130亿参数基础模型,GPT Decoder-Only 架构,未经指令微调,完成2000亿中文+英文tokens预训

          (UCloud官网开源模型使用流程)

          以下是超对称技术公司基于BBT-2的系列模型介绍:

          1.

          BBT-2-12B-Text 通用模型

          BigBang Transformer[乾元]是基于GPT Decoder-only架构的大规模预训练模型。继2022年开源BBT-1-0.2B模型之后,正式开源最新系列的BBT模型:BBT-1-1B,BBT-2-12B-Text,BBT-2.5-13B-Text。预训练语料库覆盖14个高质量数据源,覆盖书籍、百科、论文、小说、新闻、政策文件、中文博客、社交媒体等多个数据源种类。BBT-2-12B-Text基于中文700亿tokens进行预训练,经过指令微调的BBT-2基础模型可以回答百科类和日常生活的问题。BBT-2.5-13B-Text基于中文+英文 2000亿tokens进行预训练,暂时不开放基础模型的问答对话接口。

          模型开源后所有开发者可以:

          •

          可以直接调用大模型进行对话

          •

          在我们训练的基础上使用自由语料库继续训练

          •

          对大模型进行微调训练以满足各种下游任务

          2.BBT-2-12B-Text+Code 代码模型

          BBT-TC,是超对称技术公司近期发布的 BBT-2 大模型系列中的代码模型,在 百亿基座模型BBT-2-12B-Text接续训练代码数据集,通过有监督指令微调(Supervised Fine-Tuning)解锁模型的推理能力。该模型在专业评测中分数超过其他中国公司开发的同类模型,仅次于GPT-3.5。

          开发者可以在超对称公司官网https://www.ssymmetry.com测试BBT模型的代码问答(仅应用于代码生成场景,无法回答与代码无关的问题)

          详情可见文章《超对称技术公司的代码大模型CodeBBT在专业评测中位居前列,仅次于GPT-3.5》

          3.

          BBT-2-12B-TF-001 金融模型

          超对称公司于2021年便开始针对金融投资领域的应用,着手设计和训练了一个大规模参数预训练语言模型Big Bang Transformer乾元(BBT),目前发布了Base 版本2.2亿参数和Large 版本10亿参数以及最新的BBT2,120亿参数通用模型。BBT模型的目标是为金融投资建立统一的人工智能算法框架,基于transformer构建能融合训练金融投资涉及的不同模态数据的架构。在统一架构的基础上训练大规模参数预训练模型,随着模型参数和训练数据集继续增大,超对称团队有希望开发出在金融领域接近人类智能水平的模型。作为金融领域的基石模型,BBT模型为所有金融投资,经济分析,商业咨询等场景的深度学习下游任务提供微调服务。

          金融投资领域有大量从业机构和人员,大厂有财力雇佣算法工程师,小团队却用不起基本的文本抽取算法。BBT模型作为金融领域的算法基础设施,让所有从业者配备同级别的武器,让全行业站在同一起跑线去竞争更优的投资策略,从而推动金融和经济市场更高效的信息和要素流动。

          为了更好地推进中文金融自然语言处理的发展,超对称搜集和爬取了几乎所有公开可以获得的中文金融语料数据:

          1)过去20年所有主流媒体平台发布的财经政治经济新闻

          2)所有上市公司公告和财报

          3)上千万份研究院和咨询机构的研究报告

          4)百万本金融经济政治等社会科学类书籍

          5)金融社交媒体平台用户发帖

          经测试,BBT-TF在公告摘要任务场景超越ChatGPT:使用ChatGPT和BBT-TF对同一份公告,相同输入,生成摘要并对比效果,发现BBT-TF更满足实际运用场景。BBT-TF还可进行四舍五入的计算。在金融行业对数字高精度要求下,BBT-TF可对单位进行准确的换算。

          超对称已开发了11种已落地应用的下游任务,面向专业金融开发者API,已获得中国及海外金融机构付费

          4.BBT-2-12B-Image文生图模型

          基于BBT2大语言模型,超对称和中国专业图库公司联合开发文生图AIGC模型BBT-Fig,目前该模型向纺织行业,印刷,广告,游戏等行业客户提供文生图应用,经过专业评测,BBT-Fig在纺织行上的应用效果比Stable Diffusion和文心一格,明显更优。

          BBT-Fig能够生成非常逼真的图像,并且具有可控的样式和风格。在纺织行业中,BBT-Fig可以通过对不同纺织材料的图像进行学习,生成具有纹理(可无缝拼接)、色彩(色彩亮度不会受训练样本明暗影响,为标准化设计用样式)和设计元素(可随意组合元素)的纺织品图案,提高纺织品设计的效率和创新性。该技术还可用于家装等等需要图案设计的行业。

          •

          用于生成人造大理石花纹

          5.

          BBT-2-12B-Science 科学论文模型

          马斯克认为AGI的终极测试是模型能发现新的物理定律。GPT-4在医生资格考试、律师资格考试、AP考试、GRE上获得不错的分数,但目前还没有证明其能有效地发现或辅助人类知识库尚未存在的知识。

          对于中国的大模型研发团队,直接瞄准大语言模型用于科学发现是超越GPT-4的一个可能路径。在科学研究上,研究人员可以使用语言模型来自动提取和分析论文中的主题、实验方法、结果和结论,从而发现新的科学发现和研究方向。

          BBT-Science大模型是基于BBT大模型在几千万篇科研论文上训练构建的辅助科学发现的大模型,应用于物理、化学、生物、数学等不同学科的科研知识问题,可以提供三方面的能力

          1.

          快速精准的知识检索。这项能力和大模型在其他领域的对话能力相近。

          2.

          针对所研究领域的前沿问题提供新的ideas. 这种新ideas产生于大模型在该领域的海量数据检索和重新组合,发现前人未发现的可能性。

          3.

          利用多学科知识训练出的能力提供跨学科的建议和洞见。这项能力潜力最大。

          为了对科学大模型进行评测,超对称技术公司与复旦、上海交大、浙大、南航、中山大学、北师大等多所大学合作,正在号召全球一线的科研人员共同构建一个最大的科研问题评测数据集Research QA。该数据集覆盖数学、物理、化学、生物、地理地质、计算机、电子工程等主流科研领域。该数据集直接采集科研领域里前沿的研究课题作为问题,重点考察大模型回答的创新性。科学大模型将成为全球科研能力的底层引擎,带来科研生产力的加速。

          开源下载链接

          模型:

          

          超对称官网:https://bbt.ssymmetry.com/model.html

          

          Github:https://github.com/ssymmetry

          

          UCloud官方平台,请扫描下方二维码或点击阅读原文链接

          

          语料库,开源了接近1000亿tokens的预训练语料,包括通用语料和金融语料,详见:

          https://bbt.ssymmetry.com/data.html

          

          评测数据集,开源了8个中文金融大模型的评测数据集,详见:

          https://bbt.ssymmetry.com/evaluation.html

          

          论文链接:

          https://arxiv.org/abs/2302.09432

          【UCloud阅读原文链接】

          https://www.ucloud.cn/site/active/ai-bbt2.html

          注册享活动套餐

          售前咨询

          4000188113转1

          售后咨询

          4000188113转2

          网站备案咨询

          4000188113转3

          公安备案咨询

          4000188113转6

          返回顶部
          Copyright © 2012- UCloud
          优刻得科技股份有限公司
          Tel:4000188113

          UCloud与云服务

          • 公司介绍
          • 加入我们
          • 素材下载
          • 域名供应商:新网

          快速入口

          • 文档中心
          • 安全中心
          • 安全应急响应中心
          • UCloud举报平台
          • 12321举报中心
          • 互联网信息举报
          • UCloud App

          常见问题

          • API相关
          • 登录相关
          • 服务相关
          • 备案相关
          • 计费相关

          用户俱乐部

          • 用户社区
          • 推荐有礼
          沪公网安备 31011002000058号 | 沪ICP备12020087号-3
          微信二维码
          长按保存图片,在微信中扫描该二维码

          微博

          Tel:4000188113

          Copyright © 2012- UCloud
          优刻得科技股份有限公司