在 RustFS 文档中运行 SQL Server 2022
利用 RustFS 的强大功能,通过外部表函数和 PolyBase 在任何云(公共云、私有云或边缘)上运行 SQL Server 2022。
随时随地,全面覆盖
使用 SQL Server 2022 数据云查询和分析存储在 RustFS 上的多个数据源。现在,企业可以从任何 SQL Server 实例(位于公共云、私有云甚至流式边缘实例)查询存储在 RustFS 上的数据。
支持的部署环境
RustFS 与 SQL Server 2022 的集成支持以下部署环境
- AWS:Amazon Web Services 云环境
- GCP:Google Cloud Platform
- Azure:Microsoft Azure 云平台
- Tanzu:VMware Tanzu 容器平台
- OpenShift:Red Hat OpenShift 容器平台
- HPE Ezmeral:HPE 的容器平台
- SUSE Rancher:SUSE 的 Kubernetes 管理平台
- 传统裸金属部署:本地数据中心环境
统一数据访问
通过 RustFS 统一的 S3 兼容接口,SQL Server 2022 可以
- 访问跨越多个云环境的数据
- 消除数据孤岛
- 提供一致的查询体验
- 降低数据集成复杂性
连接数据,无需迁移
通过外部表,企业可以享受 SQL Server 的全部功能,而无需承担数据迁移的成本或协调挑战。
PolyBase 功能优势
PolyBase 功能允许用户使用 Transact-SQL 直接查询 SQL Server 和大多数其他数据库安装中的数据。
支持的数据源
- SQL Server:本地和云实例
- Oracle:企业级关系数据库
- Teradata:大数据分析平台
- MongoDB:NoSQL 文档数据库
- S3 API:通过 RustFS 访问对象存储
核心优势
- 零数据迁移:直接查询远程数据源
- 统一查询语言:使用熟悉的 T-SQL 语法
- 实时数据访问:无需预加载数据
- 降低存储成本:避免重复数据存储
数据孤岛集成
RustFS 提供了访问所有超大规模云环境的独特能力。SQL Server 2022 和 RustFS 的结合使企业能够
- 访问分散在不同系统中的数据
- 从数据孤岛中获得全面的洞察
- 实现统一的数据视图
- 简化复杂的数据集成场景
大规模性能
为所有企业数据提供大规模性能解决方案。
性能特征
通过这一新功能,企业可以为所有组织数据使用 SQL Server 2022。
无限数据规模
- 位置无关:数据可以位于任何地方
- 无限规模:支持 PB 级别以上的数据存储
- 快速查询:针对海量数据集的高速查询
- 并发处理:支持多用户并发访问
性能优化
借助 RustFS 行业领先的性能特征
- 高吞吐量:优化的数据传输速度
- 低延迟:对查询请求的快速响应
- 智能缓存:提高对经常访问数据的性能
- 负载均衡:自动查询负载分配
资源利用率提升
这意味着更高的利用率
- SQL Server 利用率:更充分地利用现有的 SQL Server 投资
- RustFS 实例利用率:最大化存储资源的价值
- 企业数据利用率:释放数据的全部价值
备份和恢复
实现您梦寐以求的备份和恢复。
核心用例
SQL Server 2022 和 RustFS 的核心用例之一是备份和恢复。
支持多种配置
- 多种架构:支持不同的部署架构
- 灵活配置:适应各种业务需求
- 可扩展性:随着业务增长而扩展
快速恢复能力
RustFS 行业领先的吞吐量特性
- 时间压缩:将数周的恢复时间缩短至数小时
- 高可用性:确保业务连续性
- 数据完整性:保证备份数据的完整性
- 自动化流程:减少手动干预
备份策略优化
有效的备份策略包括
- 增量备份:仅备份已更改的数据
- 差异备份:基于上次完整备份的更改
- 完全备份:定期完整数据备份
- 即时恢复:快速恢复关键业务数据
安全且可用
为确保正确的数据可供正确用户使用,必须在这些多云数据湖上实施精细的访问控制。
身份认证和授权
第三方 IDP 集成
RustFS 可以与第三方身份提供商 (IDP) 集成
- 统一身份管理:集中式用户身份管理
- 单点登录 (SSO):简化的用户访问体验
- 多因素身份验证 (MFA):增强安全性
- 角色映射:自动分配适当的权限
访问控制机制
确保对象存储的访问仅限于需要访问的用户。
- 最小权限原则:仅授予必要的权限
- 定期权限审查:确保权限及时性
- 访问日志:完整的审计跟踪
- 异常检测:识别异常访问行为
基于策略的访问控制 (PBAC)
精细权限管理
RustFS 复杂的 PBAC 功能确保
- 资源级控制:对特定资源的精确权限
- 动态权限分配:根据上下文调整权限
- 策略继承:简化权限管理
- 合规支持:满足法规要求
安全保障
- 数据加密:传输和存储过程中的加密保护
- 网络隔离:安全的网络通信
- 威胁检测:实时安全威胁监控
- 事件响应:对安全事件的快速响应
弹性
SQL Server 是企业中最常用的分析工具之一,使其成为一项关键任务应用。
灾难恢复能力
持续数据复制
SQL Server 2022 允许与云之间进行持续的数据复制。
- 实时同步:确保数据是最新的
- 双向复制:支持 Active-Active 部署
- 冲突解决:自动处理数据冲突
- 故障转移:快速切换到备份系统
分层存储策略
与 RustFS 的结合允许
- 快速存储层:NVMe 高速存储
- 温存储层:平衡性能与成本
- 冷存储层:长期归档存储
- 自动分层:智能数据迁移
数据处理能力
多种处理方法
企业可以通过多种方法读写和处理大数据。
- Transact-SQL:传统的 SQL 查询语言
- Spark 库:大数据处理框架
- 混合分析:结合关系型和非关系型数据
- 实时处理:流数据处理能力
高可用性架构
- 多站点部署:跨区域数据分发
- Active-Active 复制:提供最高可用性
- 严格一致性:确保数据一致性
- 云灾难恢复:抵抗整体云故障
流式边缘
通过添加外部表功能,企业现在可以设置流式管道,将数据保存在 RustFS 中——无论是云端还是本地。
实时数据处理
流式数据管道
- 实时数据摄取:持续接收流数据
- 数据预处理:清洗和转换数据
- 存储优化:高效的数据存储
- 查询优化:流式数据的查询优化
实时查询能力
可以将 SQL Server 配置为实时处理这些数据上的查询。
- 消除批量导入:无需等待批量处理
- 即时洞察:实时业务洞察
- 减少延迟:最大程度减少数据处理延迟
- 增强体验:为 SQL Server 增添新维度
边缘计算优势
边缘部署特点
- 低延迟处理:在靠近源头的地方处理数据
- 带宽优化:减少数据传输
- 离线能力:支持间歇性连接
- 本地智能:边缘智能决策
应用场景
- 物联网数据处理:物联网设备数据
- 实时监控:系统状态监控
- 预测性维护:设备故障预测
- 智能制造:生产过程优化
云作为操作系统
从 S3 开始的云操作系统。
云操作特性
RustFS 遵循云操作系统。
核心技术栈
- 容器化:容器化应用部署
- 编排:Kubernetes 容器编排
- 自动化:自动化运维管理
- API 驱动:完整的 API 接口
- S3 兼容性:标准 S3 API 支持
统一接口优势
提供跨云和存储类型的统一接口。
- 简化开发:统一的开发接口
- 降低学习成本:标准化的操作方法
- 提高可移植性:跨云应用迁移
- 减少锁定:避免供应商锁定
AI/ML 框架兼容性
广泛的框架支持
由于大多数 AI/ML 框架和应用程序都设计为使用 S3 API
- TensorFlow:Google 的机器学习框架
- PyTorch:Facebook 的深度学习框架
- Scikit-learn:Python 机器学习库
- Apache Spark:大数据处理引擎
开发者验证
超过 13 亿次的 Docker 拉取
- 开发者验证最多:广泛的开发者社区
- 全天候验证:持续的兼容性验证
- 最佳兼容性:行业最佳兼容性记录
- 生产就绪:大规模生产验证
数据管理灵活性
这种兼容性确保
- AI 工作负载访问:无缝访问存储的数据
- 云基础设施无关:独立于特定云环境
- 灵活的数据方法:适应不同的数据处理需求
- 跨云环境处理:支持多云数据处理
边缘 AI 存储
在边缘,网络延迟、数据丢失和软件臃肿会降低性能。
边缘优化功能
性能优势
RustFS 是世界上最快的对象存储。
- 小于 100MB:极小的二进制文件
- 任何硬件:可部署在任何硬件上
- 高性能:优化的边缘性能
- 低资源消耗:最小的系统要求
智能功能
RustFS 的高级功能
- 存储桶通知:存储桶事件通知
- 对象 Lambda:对象处理函数
- 实时推理:即时数据处理
- 自动触发器:基于事件的自动处理
边缘应用场景
关键任务应用
- 空中目标检测:高空无人机应用
- 交通轨迹预测:自动驾驶汽车
- 工业控制:实时工业控制系统
- 安全监控:实时安全监控
技术特点
RustFS 的 AI 存储功能
- 快速响应:毫秒级响应时间
- 容错能力:高可靠性设计
- 部署简单:简化的部署过程
- 边缘优化:针对边缘场景进行了优化
ML/AI 工作负载的生命周期管理
现代 AI/ML 工作负载需要复杂的生命周期管理。
自动化数据管理
核心功能
RustFS 的生命周期管理功能
- 自动化任务:自动执行数据管理任务
- 存储优化:优化存储效率
- 降低开销:减少运营开销
- 智能分层:自动数据分层
成本优化策略
通过生命周期策略
- 自动迁移:将访问频率较低的数据迁移到低成本存储
- 释放资源:为活动工作负载释放资源
- 存储分层:多层存储架构
- 成本控制:有效的存储成本控制
ML/AI 特有功能
开发者体验
这些功能确保 AI/ML 从业者能够
- 专注核心:专注于模型训练和开发
- 自动管理:RustFS 智能管理数据
- 性能增强:提高整体工作流程性能
- 成本效益:实现最大成本效益
合规支持
生命周期管理层
- 强制执行策略:强制执行保留和删除策略
- 法规合规:确保符合法规要求
- 审计跟踪:完整的操作记录
- 自动合规:自动合规流程
AI/ML 工作负载的对象保留
与 AI/ML 相比,很少有工作负载比这更依赖于事件发生的时间。
高级对象保留
核心保证
通过高级对象保留功能解决。
- 数据完整性:确保存储数据的完整性
- 合规要求:满足法规合规要求
- 时效性:处理与时间相关的业务需求
- 数据一致性:保持数据一致性
保留策略实施
通过实施保留策略,RustFS 可以帮助组织
- 模型一致性:保持 AI/ML 模型和数据集的数据一致性
- 防止意外删除:避免意外或未经授权的删除
- 防止修改:保护数据免遭未经授权的修改
- 版本控制:维护数据版本历史
数据治理优势
治理框架
此功能对于以下方面至关重要
- 数据治理:建立全面的数据治理框架
- 法规合规:满足各种法规要求
- 实验可重复性:确保 AI/ML 实验的可重复性
- 数据谱系:完整的数据谱系跟踪
保证机制
保证关键数据
- 指定时长:在指定时间内保持可访问状态
- 数据不可变性:确保数据不被修改
- 精确训练:支持精确的模型训练
- 可靠分析:提供可靠的数据分析基础
核心 AI 数据集的数据保护
RustFS 通过不同的功能数量提供全面的数据保护。
数据冗余和容错
保护机制
- 纠删码:高效的数据冗余机制
- 站点复制:跨站点数据复制
- 数据冗余:确保数据存储冗余
- 容错能力:防止硬件故障或数据损坏
故障恢复
自动处理各种故障场景。
- 硬件故障:自动检测和恢复
- 数据损坏:实时检测和修复
- 网络故障:从网络中断中自动恢复
- 站点故障:跨站点故障转移
数据加密保护
加密机制
RustFS 支持多级数据加密。
- 静态加密:对存储数据的加密保护
- 传输中加密:数据传输过程中的加密
- 密钥管理:安全的密钥管理机制
- 合规加密:符合合规要求的加密标准
访问控制
- 未经授权的访问保护:防止未经授权的数据访问
- 身份验证:强制执行身份验证机制
- 权限控制:精细的权限控制
- 访问监控:实时访问行为监控
身份和访问管理 (IAM)
IAM 支持
RustFS 的 IAM 支持使组织能够
- 访问控制:控制对 AI 存储数据的访问
- 用户管理:统一的用户管理
- 应用程序授权:应用程序访问控制
- 权限分配:灵活的权限分配机制
安全保障
确保只有授权用户或应用程序才能
- 访问数据:安全的数据访问
- 修改数据:受控的数据修改
- 删除数据:安全的数据删除
- 管理权限:权限管理操作
全生命周期保护
全面的保护机制
RustFS 提供全面的数据保护机制。
- 完整性保护:保持 AI 数据集的完整性
- 可用性保障:确保高数据可用性
- 保密性保护:保护数据机密性
- 生命周期覆盖:覆盖整个数据生命周期
通过 SQL Server 2022 与 RustFS 的深度集成,企业可以构建一个强大、安全、高性能的现代数据平台,支持从传统关系型数据处理到最新的 AI/ML 工作负载的全面需求。