跳到内容

在 RustFS 文档中运行 SQL Server 2022

利用 RustFS 的强大功能,通过外部表函数和 PolyBase 在任何云(公共云、私有云或边缘)上运行 SQL Server 2022。

随时随地,全面覆盖

使用 SQL Server 2022 数据云查询和分析存储在 RustFS 上的多个数据源。现在,企业可以从任何 SQL Server 实例(位于公共云、私有云甚至流式边缘实例)查询存储在 RustFS 上的数据。

支持的部署环境

RustFS 与 SQL Server 2022 的集成支持以下部署环境

  • AWS:Amazon Web Services 云环境
  • GCP:Google Cloud Platform
  • Azure:Microsoft Azure 云平台
  • Tanzu:VMware Tanzu 容器平台
  • OpenShift:Red Hat OpenShift 容器平台
  • HPE Ezmeral:HPE 的容器平台
  • SUSE Rancher:SUSE 的 Kubernetes 管理平台
  • 传统裸金属部署:本地数据中心环境

统一数据访问

通过 RustFS 统一的 S3 兼容接口,SQL Server 2022 可以

  • 访问跨越多个云环境的数据
  • 消除数据孤岛
  • 提供一致的查询体验
  • 降低数据集成复杂性

连接数据,无需迁移

通过外部表,企业可以享受 SQL Server 的全部功能,而无需承担数据迁移的成本或协调挑战。

PolyBase 功能优势

PolyBase 功能允许用户使用 Transact-SQL 直接查询 SQL Server 和大多数其他数据库安装中的数据。

支持的数据源

  • SQL Server:本地和云实例
  • Oracle:企业级关系数据库
  • Teradata:大数据分析平台
  • MongoDB:NoSQL 文档数据库
  • S3 API:通过 RustFS 访问对象存储

核心优势

  1. 零数据迁移:直接查询远程数据源
  2. 统一查询语言:使用熟悉的 T-SQL 语法
  3. 实时数据访问:无需预加载数据
  4. 降低存储成本:避免重复数据存储

数据孤岛集成

RustFS 提供了访问所有超大规模云环境的独特能力。SQL Server 2022 和 RustFS 的结合使企业能够

  • 访问分散在不同系统中的数据
  • 从数据孤岛中获得全面的洞察
  • 实现统一的数据视图
  • 简化复杂的数据集成场景

大规模性能

为所有企业数据提供大规模性能解决方案。

性能特征

通过这一新功能,企业可以为所有组织数据使用 SQL Server 2022。

无限数据规模

  • 位置无关:数据可以位于任何地方
  • 无限规模:支持 PB 级别以上的数据存储
  • 快速查询:针对海量数据集的高速查询
  • 并发处理:支持多用户并发访问

性能优化

借助 RustFS 行业领先的性能特征

  1. 高吞吐量:优化的数据传输速度
  2. 低延迟:对查询请求的快速响应
  3. 智能缓存:提高对经常访问数据的性能
  4. 负载均衡:自动查询负载分配

资源利用率提升

这意味着更高的利用率

  • SQL Server 利用率:更充分地利用现有的 SQL Server 投资
  • RustFS 实例利用率:最大化存储资源的价值
  • 企业数据利用率:释放数据的全部价值

备份和恢复

实现您梦寐以求的备份和恢复。

核心用例

SQL Server 2022 和 RustFS 的核心用例之一是备份和恢复。

支持多种配置

  • 多种架构:支持不同的部署架构
  • 灵活配置:适应各种业务需求
  • 可扩展性:随着业务增长而扩展

快速恢复能力

RustFS 行业领先的吞吐量特性

  1. 时间压缩:将数周的恢复时间缩短至数小时
  2. 高可用性:确保业务连续性
  3. 数据完整性:保证备份数据的完整性
  4. 自动化流程:减少手动干预

备份策略优化

有效的备份策略包括

  • 增量备份:仅备份已更改的数据
  • 差异备份:基于上次完整备份的更改
  • 完全备份:定期完整数据备份
  • 即时恢复:快速恢复关键业务数据

安全且可用

为确保正确的数据可供正确用户使用,必须在这些多云数据湖上实施精细的访问控制。

身份认证和授权

第三方 IDP 集成

RustFS 可以与第三方身份提供商 (IDP) 集成

  • 统一身份管理:集中式用户身份管理
  • 单点登录 (SSO):简化的用户访问体验
  • 多因素身份验证 (MFA):增强安全性
  • 角色映射:自动分配适当的权限

访问控制机制

确保对象存储的访问仅限于需要访问的用户。

  1. 最小权限原则:仅授予必要的权限
  2. 定期权限审查:确保权限及时性
  3. 访问日志:完整的审计跟踪
  4. 异常检测:识别异常访问行为

基于策略的访问控制 (PBAC)

精细权限管理

RustFS 复杂的 PBAC 功能确保

  • 资源级控制:对特定资源的精确权限
  • 动态权限分配:根据上下文调整权限
  • 策略继承:简化权限管理
  • 合规支持:满足法规要求

安全保障

  • 数据加密:传输和存储过程中的加密保护
  • 网络隔离:安全的网络通信
  • 威胁检测:实时安全威胁监控
  • 事件响应:对安全事件的快速响应

弹性

SQL Server 是企业中最常用的分析工具之一,使其成为一项关键任务应用。

灾难恢复能力

持续数据复制

SQL Server 2022 允许与云之间进行持续的数据复制。

  • 实时同步:确保数据是最新的
  • 双向复制:支持 Active-Active 部署
  • 冲突解决:自动处理数据冲突
  • 故障转移:快速切换到备份系统

分层存储策略

与 RustFS 的结合允许

  1. 快速存储层:NVMe 高速存储
  2. 温存储层:平衡性能与成本
  3. 冷存储层:长期归档存储
  4. 自动分层:智能数据迁移

数据处理能力

多种处理方法

企业可以通过多种方法读写和处理大数据。

  • Transact-SQL:传统的 SQL 查询语言
  • Spark 库:大数据处理框架
  • 混合分析:结合关系型和非关系型数据
  • 实时处理:流数据处理能力

高可用性架构

  • 多站点部署:跨区域数据分发
  • Active-Active 复制:提供最高可用性
  • 严格一致性:确保数据一致性
  • 云灾难恢复:抵抗整体云故障

流式边缘

通过添加外部表功能,企业现在可以设置流式管道,将数据保存在 RustFS 中——无论是云端还是本地。

实时数据处理

流式数据管道

  • 实时数据摄取:持续接收流数据
  • 数据预处理:清洗和转换数据
  • 存储优化:高效的数据存储
  • 查询优化:流式数据的查询优化

实时查询能力

可以将 SQL Server 配置为实时处理这些数据上的查询。

  1. 消除批量导入:无需等待批量处理
  2. 即时洞察:实时业务洞察
  3. 减少延迟:最大程度减少数据处理延迟
  4. 增强体验:为 SQL Server 增添新维度

边缘计算优势

边缘部署特点

  • 低延迟处理:在靠近源头的地方处理数据
  • 带宽优化:减少数据传输
  • 离线能力:支持间歇性连接
  • 本地智能:边缘智能决策

应用场景

  • 物联网数据处理:物联网设备数据
  • 实时监控:系统状态监控
  • 预测性维护:设备故障预测
  • 智能制造:生产过程优化

云作为操作系统

从 S3 开始的云操作系统。

云操作特性

RustFS 遵循云操作系统。

核心技术栈

  • 容器化:容器化应用部署
  • 编排:Kubernetes 容器编排
  • 自动化:自动化运维管理
  • API 驱动:完整的 API 接口
  • S3 兼容性:标准 S3 API 支持

统一接口优势

提供跨云和存储类型的统一接口。

  1. 简化开发:统一的开发接口
  2. 降低学习成本:标准化的操作方法
  3. 提高可移植性:跨云应用迁移
  4. 减少锁定:避免供应商锁定

AI/ML 框架兼容性

广泛的框架支持

由于大多数 AI/ML 框架和应用程序都设计为使用 S3 API

  • TensorFlow:Google 的机器学习框架
  • PyTorch:Facebook 的深度学习框架
  • Scikit-learn:Python 机器学习库
  • Apache Spark:大数据处理引擎

开发者验证

超过 13 亿次的 Docker 拉取

  • 开发者验证最多:广泛的开发者社区
  • 全天候验证:持续的兼容性验证
  • 最佳兼容性:行业最佳兼容性记录
  • 生产就绪:大规模生产验证

数据管理灵活性

这种兼容性确保

  • AI 工作负载访问:无缝访问存储的数据
  • 云基础设施无关:独立于特定云环境
  • 灵活的数据方法:适应不同的数据处理需求
  • 跨云环境处理:支持多云数据处理

边缘 AI 存储

在边缘,网络延迟、数据丢失和软件臃肿会降低性能。

边缘优化功能

性能优势

RustFS 是世界上最快的对象存储。

  • 小于 100MB:极小的二进制文件
  • 任何硬件:可部署在任何硬件上
  • 高性能:优化的边缘性能
  • 低资源消耗:最小的系统要求

智能功能

RustFS 的高级功能

  1. 存储桶通知:存储桶事件通知
  2. 对象 Lambda:对象处理函数
  3. 实时推理:即时数据处理
  4. 自动触发器:基于事件的自动处理

边缘应用场景

关键任务应用

  • 空中目标检测:高空无人机应用
  • 交通轨迹预测:自动驾驶汽车
  • 工业控制:实时工业控制系统
  • 安全监控:实时安全监控

技术特点

RustFS 的 AI 存储功能

  • 快速响应:毫秒级响应时间
  • 容错能力:高可靠性设计
  • 部署简单:简化的部署过程
  • 边缘优化:针对边缘场景进行了优化

ML/AI 工作负载的生命周期管理

现代 AI/ML 工作负载需要复杂的生命周期管理。

自动化数据管理

核心功能

RustFS 的生命周期管理功能

  • 自动化任务:自动执行数据管理任务
  • 存储优化:优化存储效率
  • 降低开销:减少运营开销
  • 智能分层:自动数据分层

成本优化策略

通过生命周期策略

  1. 自动迁移:将访问频率较低的数据迁移到低成本存储
  2. 释放资源:为活动工作负载释放资源
  3. 存储分层:多层存储架构
  4. 成本控制:有效的存储成本控制

ML/AI 特有功能

开发者体验

这些功能确保 AI/ML 从业者能够

  • 专注核心:专注于模型训练和开发
  • 自动管理:RustFS 智能管理数据
  • 性能增强:提高整体工作流程性能
  • 成本效益:实现最大成本效益

合规支持

生命周期管理层

  • 强制执行策略:强制执行保留和删除策略
  • 法规合规:确保符合法规要求
  • 审计跟踪:完整的操作记录
  • 自动合规:自动合规流程

AI/ML 工作负载的对象保留

与 AI/ML 相比,很少有工作负载比这更依赖于事件发生的时间。

高级对象保留

核心保证

通过高级对象保留功能解决。

  • 数据完整性:确保存储数据的完整性
  • 合规要求:满足法规合规要求
  • 时效性:处理与时间相关的业务需求
  • 数据一致性:保持数据一致性

保留策略实施

通过实施保留策略,RustFS 可以帮助组织

  1. 模型一致性:保持 AI/ML 模型和数据集的数据一致性
  2. 防止意外删除:避免意外或未经授权的删除
  3. 防止修改:保护数据免遭未经授权的修改
  4. 版本控制:维护数据版本历史

数据治理优势

治理框架

此功能对于以下方面至关重要

  • 数据治理:建立全面的数据治理框架
  • 法规合规:满足各种法规要求
  • 实验可重复性:确保 AI/ML 实验的可重复性
  • 数据谱系:完整的数据谱系跟踪

保证机制

保证关键数据

  • 指定时长:在指定时间内保持可访问状态
  • 数据不可变性:确保数据不被修改
  • 精确训练:支持精确的模型训练
  • 可靠分析:提供可靠的数据分析基础

核心 AI 数据集的数据保护

RustFS 通过不同的功能数量提供全面的数据保护。

数据冗余和容错

保护机制

  • 纠删码:高效的数据冗余机制
  • 站点复制:跨站点数据复制
  • 数据冗余:确保数据存储冗余
  • 容错能力:防止硬件故障或数据损坏

故障恢复

自动处理各种故障场景。

  1. 硬件故障:自动检测和恢复
  2. 数据损坏:实时检测和修复
  3. 网络故障:从网络中断中自动恢复
  4. 站点故障:跨站点故障转移

数据加密保护

加密机制

RustFS 支持多级数据加密。

  • 静态加密:对存储数据的加密保护
  • 传输中加密:数据传输过程中的加密
  • 密钥管理:安全的密钥管理机制
  • 合规加密:符合合规要求的加密标准

访问控制

  • 未经授权的访问保护:防止未经授权的数据访问
  • 身份验证:强制执行身份验证机制
  • 权限控制:精细的权限控制
  • 访问监控:实时访问行为监控

身份和访问管理 (IAM)

IAM 支持

RustFS 的 IAM 支持使组织能够

  • 访问控制:控制对 AI 存储数据的访问
  • 用户管理:统一的用户管理
  • 应用程序授权:应用程序访问控制
  • 权限分配:灵活的权限分配机制

安全保障

确保只有授权用户或应用程序才能

  1. 访问数据:安全的数据访问
  2. 修改数据:受控的数据修改
  3. 删除数据:安全的数据删除
  4. 管理权限:权限管理操作

全生命周期保护

全面的保护机制

RustFS 提供全面的数据保护机制。

  • 完整性保护:保持 AI 数据集的完整性
  • 可用性保障:确保高数据可用性
  • 保密性保护:保护数据机密性
  • 生命周期覆盖:覆盖整个数据生命周期

通过 SQL Server 2022 与 RustFS 的深度集成,企业可以构建一个强大、安全、高性能的现代数据平台,支持从传统关系型数据处理到最新的 AI/ML 工作负载的全面需求。

根据 Apache 许可证 2.0 发布。