クラウドコンピューティングサービスを提供するSalesforceのAI研究部門・Salesforce AI Researchが、1兆ものテキストトークンを含むオープンソースのマルチモーダルデータセット「MINT-1T」を公開しました。GitHub - mlfoundations/MINT-1T: MINT-1T: A one trillion token multimodal interleaved dataset.https://github.com/mlfoundations/MINT-1TMINT-1T: Scaling Open-Source Multimodal Data by 10x: A Multimodal Dataset w