7 月 9 日,GOTC 2021 全球开源技术峰会上海站与 WAIC 世界人工智能大会共同举办,峰会聚焦 AI 与云原生两大以开源驱动的前沿技术领域,邀请国家级研究机构与顶级互联网公司的一线技术专家,为参会的开发者和技术爱好者带来了最硬的行业技术干货,提供了一个难得的技术交流平台. 在本次会议上,腾讯云高级工程师高策进行了题为"公有云上构建云原生 AI 平台的探索与实践"的技术分享,介绍了 AI 类业务在公有云上的现状以及相应的技术选型和面临的问题.最后通过分析开源社区和业界的趋势,…
作为云原生技术先驱,腾讯云数据库内核团队致力于不断提升产品的可用性.可靠性.性能和可扩展性,为用户提供更加极致的体验.为帮助用户了解极致体验背后的关键技术点,本期带来腾讯云数据库专家工程师王鲁俊给大家分享的腾讯云原生数据库TDSQL-C的架构探索和实践,内容主要分为四个部分: 本次分享主要分为四个部分: 第一部分,介绍腾讯云原生数据库 TDSQL-C 产品架构,包括产品的研发背景和架构主要特性: 第二部分,分享用户场景实践,针对线上真实的用户场景做一些分析和针对性实践: 第三部分,分享系统关键优…
作者 张鹏,腾讯云容器产品工程师,拥有多年云原生项目开发落地经验.目前主要负责腾讯云 TKE 云原生 AI 产品的开发工作. 谢远东,腾讯高级工程师,Kubeflow Member.Fluid(CNCF Sandbox) 核心开发者,负责腾讯云 TKE 在 AI 场景的研发和支持工作. 概述 随着 Kubernetes 的日趋成熟,越来越多的公司.企业开始使用 K8s 来构建自己的云原生平台,基于 kubernetes 良好的扩展性以及成熟稳定的架构,你可以快速部署并管理自己的云原生应用. 目前…
按照上篇文章<解锁云原生 AI 技能 | 在 Kubernetes 上构建机器学习系统>搭建了一套 Kubeflow Pipelines 之后,我们一起小试牛刀,用一个真实的案例,学习如何开发一套基于 Kubeflow Pipelines 的机器学习工作流. 准备工作 机器学习工作流是一个任务驱动的流程,同时也是数据驱动的流程,这里涉及到数据的导入和准备.模型训练 Checkpoint 的导出评估.到最终模型的导出.这就需要分布式存储作为传输的媒介,此处使用 NAS 作为分布式存储. 创建分布…
云原生技术的发展正在改变全球软件业的格局,随着云原生技术生态体系的日趋完善,灵雀云的云原生平台也进入了成熟阶段.近日,灵雀云发布重大产品升级,推出全栈云原生开放平台ACP 3.0.作为面向企业级用户的云原生平台,ACP 3.0遵循"云原生+开源"的思路,同时对接了大量的第三方商业化产品和服务,真正实现一体全栈,帮助企业加速构建.运行及管理现代化应用. 作为曾两度入选Gartner容器和PaaS领域权威报告的厂商,灵雀云基于对云原生技术的前瞻探索和客户场景需求的敏锐把握,不断进行产品迭代…
某个周一上午,小涛像往常一样泡上一杯热咖啡 ️,准备打开项目协同开始新一天的工作,突然隔壁的小文喊道:"快看,用户支持群里炸锅了 -" 用户 A:"Git 服务有点问题,代码提交失败了!" 用户 B:"帮忙看一下,执行流水线报错--" 用户 C:"我们的系统今天要上线,现在部署页面都打不开了,都要急坏了!" 用户 D:-- 小涛只得先放下手中的咖啡,屏幕切换到堡垒机,登录到服务器上一套行云流水的操作,"哦,原来是上周…
2020 年末,谷歌旗下 DeepMind 研发的 AI 程序 AlphaFold2 在国际蛋白质结构预测竞赛上取得惊人的准确度,使得" AI 预测蛋白质结构"这一领域受到了空前的关注.今天我们邀请到同领域企业,深势科技为大家分享其搭建基础平台时的实践与思考.AI 场景中的使用的数据有哪些新特点?混合云架构如何与超算平台结合?为何会选择 JuiceFS? 背景 深势科技成立于 2018 年,是 "AI for Science" 科学研究范式的先行者,致力于运用人工智…
本系列将利用阿里云容器服务,帮助您上手 Kubeflow Pipelines. 介绍 机器学习的工程复杂度,除了来自于常见的软件开发问题外,还和机器学习数据驱动的特点相关.而这就带来了其工作流程链路更长,数据版本失控,实验难以跟踪.结果难以重现,模型迭代成本巨大等一系列问题.为了解决这些机器学习固有的问题,很多企业构建了内部机器学习平台来管理机器学习生命周期,其中最有名的是 Google 的 Tensorflow Extended, Facebook 的 FBLearner Flow, Uber…
分布式训练与 Kubeflow 当开发者想要讲深度学习的分布式训练搬上 Kubernetes 集群时,首先想到的往往就是 Kubeflow 社区中形形色色的 operators,如 tf-operator.mpi-operator. 这些服务于各种深度学习训练(TensorFlow.PyTorch.MXNet 等)的 operators 主要的工作包括: 在 Kubernetes 集群上创建 Pod 以拉起各个训练进程 配置用作服务发现的信息(如 TF_CONFIG)以及创建相关 Kuberne…
阿里巴巴新一代自研云数据库POLARDB与超图软件SuperMap GIS实现 “引擎级”深度对接,构建了自治.弹性.高可用的云原生时空数据管理平台联合解决方案,推出了业界首个“云原生数据库+云原生GIS”的全国产化平台. 1.阿里云POLARDB POLARDB是阿里云自主研发的国内首个云原生数据库,兼容三种数据库引擎:MySQL.PostgreSQL.Oracle.采用了存储计算分离.软硬一体化等创新设计,满足大规模业务场景上云需求. POLARDB集成Ganos时空引擎,基于属性-时间-空…