文档

什么是DSW

更新时间:

DSW(Data Science Workshop)是为算法开发者量身打造的一站式AI开发平台,集成了JupyterLab、WebIDE、Terminal多种云端开发环境,提供代码编写、调试及运行的沉浸式体验。DSW提供丰富的异构计算资源,支持挂载OSS、NAS、CPFS类型的数据集,预置了多种开源框架的镜像,支持实例的生命周期管理,实现开箱即用的高效开发模式。

快速入门

您可以参考如下视频,快速了解DSW支持的主要功能。

功能特性

  • 一站式服务

    • DSW支持挂载OSS、NAS、CPFS等文件系统,支持接入MaxCompute数据。

    • 提供了DLC和EAS工具,实现了从数据处理到开发调试、训练模型以及将模型部署的AI开发全链路。

  • 灵活易用

    • 提供丰富的异构计算资源,包括公共资源组和专有资源组,用户可以灵活选择和变更配置。

    • 支持多种开源框架的镜像,并且支持用户制作自定义镜像。

    • 内置Notebook、WebIDE、Terminal等开发环境,满足个性化开发需求。

    • 除Python之外,还支持R语言和SQL语句的编写和执行。

  • 精细化管理

    • 支持定时关机、闲置关机等生命周期管理配置,帮助用户节省成本。

    • 提供CPU/GPU/内存水位实时监控,让用户实时掌握资源使用情况,及时调整任务分配和优化代码性能。

  • 场景化实践

    • Notebook Gallery提供了LLM、AIGC前沿领域的教程案例,打造属于开发者的内容平台,支持用户快速上手,以及对感兴趣的内容进行二次开发。

  • 企业级能力

    • 工作空间管理员可以进行全局资源分配,以及配置资源回收策略。

应用场景

  • 机器学习和数据科学

    DSW支持JupyterLab交互式编程环境,预置了PyTorch、Tensorflow等丰富的镜像,算法人员和数据科学家可以轻松地进行数据工程、模型开发和训练、可视化分析等任务,无需担心资源运维和环境配置。

  • AIGC和大模型

    Notebook Gallery提供了海量前沿案例,以Notebook的形式介绍了热门场景的最佳实践,如Stable Diffusion、Llama2、通义千问等。用户可以直接在DSW运行这些教程,在实践中学习,也可以基于教程二次开发,打造自己的创意场景。

  • AI+大数据一体化

    DSW除了支持Python和R语言之外,还对接了大数据的能力,用户能够通过SQL File插件,使用SQL语句对MaxCompute数据源进行数据查询,或通过Notebook连接EMR集群提交Spark任务。

  • 本页导读 (1)
文档反馈