
利用微软的. NET和JDBC更新增强AI工作负载
人工智能 (AI) 的普及程度日益提升,与此同时,构建一个强大的架构框架来支持 AI 驱动的解决方案的需求也日益凸显。为了满足这一需求,微软对其. NET 和 JDBC 生态系统进行了重大改进,引入了对矢量数据类型的原生支持。这项改进旨在为 AI 任务构建高性能环境。
.NET中Sqlvector的介绍
.NET 中一个突出的更新是引入了Sqlvector类,该类是Microsoft. Data. SqlClient 6.1.0中的新功能。这个新类旨在以向量格式管理数据,这与之前使用的 JSON 数组格式相比有了显著的升级,而 JSON 数组格式通常效率低下。
采用向量数据类型的优势非常显著。性能测试表明,性能提升显著:读取操作速度可提升高达 50 倍,写入操作速度可提升高达 3.3 倍,批量复制操作速度可提升高达 19 倍。这些测量数据来自 SQL Server 2025 预览版的测试,测试中使用最大大小为 1998 的向量列,每次操作测试 10, 000 条记录。
内存效率和未来潜力
本次更新的另一个显著优势是减少了内存消耗。由于不再需要 JSON 序列化,因此通过消除冗长的字符串表示形式,最大限度地减少了内存占用。目前,系统支持 32 位浮点向量,并有望在未来扩展对其他数字数据类型的支持,从而增强系统的适应性。
JDBC 环境中的向量支持
为了过渡到 JDBC 生态系统,微软在 SQL Server JDBC 驱动程序 13.1.0 中推出了新的VECTOR数据类型。此数据类型可有效用于各种操作,包括插入、选择、存储过程和批量复制。此外,此版本删除了基于字符串的向量处理,使其与基于 Java 的 AI 应用程序(包括具有语义搜索功能的应用程序)高度兼容。
广泛的兼容性和协议考虑
需要强调的是,这些增强功能适用于众多平台,包括 SQL Server 2025 (17.x) 预览版、Azure SQL 数据库、Azure SQL 托管实例以及 Microsoft Fabric 预览版中的 SQL 数据库。此外,这些改进是通过优化表格数据流 (TDS) 协议实现的,这意味着它们仅适用于 TDS 7.4 及更高版本。使用早期协议版本的客户端仍将使用varchar(max)数据类型,并将数据处理为 JSON 数组以实现向后兼容,因此无法享受这些重大改进。
发表回复