BloombergGPT 是一种新的金融领域语言模型,具有 500 亿个参数,使用金融数据进行训练。

它声称拥有迄今为止最大的领域特定数据集,包含 3630 亿个 token,并通过从通用数据集中获取的 3450 亿个 token 进一步增强。

它在金融任务上表现优异,同时不会牺牲在通用语言模型基准测试上的性能。

相关链接:https://arxiv.org/abs/2303.17564v1