点击围观!腾讯 TAPD 助力金融行业研发提效、敏捷转型最佳实践! 了解详情
写点什么

MLSQL 正式更名 Byzer ,全新开源社区同步上线

  • 2021-12-21
  • 本文字数:2226 字

    阅读完需:约 7 分钟

MLSQL 正式更名Byzer ,全新开源社区同步上线

12 月 21 日,开源项目 MLSQL 宣布正式更名为 Byzer。Byzer 将秉持 MLSQL 低成本落地 Data + AI 的技术初衷,并融合更加开放且多元的语言及产品能力,打造更加完善的新一代开源语言生态。与此同时,全新的 Byzer 开源社区正式成立,社区官网(https://www.byzer.org) 也已同步上线,欢迎大家积极访问。

全新的 Byzer,让数据说“人话”

 

Byzer 这一名称源于中国古代神兽“白泽”,其能言语,通万物之情,知鬼神之事。我们希望 Byzer 可以像神兽白泽一样,让数据说“人”话。

 

Byzer 是一门结合了声明式编程和命令式编程的混合编程语言,其低代码且类 SQL 的编程逻辑配合内置算法及插件的加持,能帮助数据工作者们高效打通数据链路,完成数据的清洗转换,并快速地进行机器学习相关的训练及预测。Byzer 语言的关键词如下:


  • 万物皆表(Everything is a table)

  • 类 SQL 语法(SQL-like Language)

  • 内置算法和插件(Built-in algorithms and plugins)

  • 可定制,简单,强大(Customizable, Simple and Powerful)

 

Byzer 社区主要围绕 Byzer 语言来打造面向 Data + AI 领域的开源生态,旨在帮助用户以低成本和高效率的方式落地数据平台和完成 AI 工程化,释放分析师、工程师以及运维人员的生产力。目前 Byzer 社区内的项目均采用 Apache License V2 发行,允许所有社区参与者在该协议下进行自由使用。

为什么需要 Byzer

 

随着大数据、人工智能、云计算等技术的迅速发展,云基础设施、基础软件、算法模型等都逐渐完善和成熟,业界对数据平台的效率诉求是越来越高,低效的跨平台数据运转逐渐成为工程师落地数据平台和完成 AI 工程化的痛点。但是,无论是从更换基础设施入手,还是换上更易用的框架,又或是招聘更优秀的研发人才,都无法做到大幅度的效率提升。

 

我们相信只有在编程语言层面进行革新,才能从根本上提高数据平台落地和 AI 工程化的效率。Byzer 作为一门低代码的开源编程语言,可以在语言层面将数据处理链路、AI 工程中的复杂操作以及权限管控进行抽象,同时降低编程语言的学习成本和上手成本,从而帮助企业真正将效率提升上来。

Byzer 语言设计理念

 

在抽象业务能力的时候,数据的处理和流转承载着信息传递的核心任务,而数据的载体往往就是二维数据表或多维数据表,SQL 语言其实就是抽象在二维数据表上的各种数据操作。Byzer 语言的核心设计是万物皆表(Everything is a table),我们希望用户可以非常容易的将任何实体对象通过 Byzer 来抽象成二维表,从而能够基于表来进行数据处理或模型训练等进一步操作。

1、声明式融合命令式的语言设计,SQL-like 语法简单又灵活


在语言设计层面,Byzer 采用了声明式编程设计,使用类 SQL 的语法,开发者更容易学习和使用。但是声明式设计又缺乏一些灵活性,无法满足一些很复杂的编程需求,所以 Byzer 在声明式设计的基础上又结合了命令式编程设计来对 SQL-like 的语法进行扩展。

2、云原生设计,充分利用云上算力和便宜的存储


在云基础设施日趋成熟的今天,无论是基础软件还是上层应用,用户都十分关注可扩展性,Byzer 在 Day1 的设计就是云原生设计,不仅能够利用云上便宜的存储,同时原生分布式引擎(Spark 引擎和可插拔 Ray 引擎)的设计,可以让 Byzer 充分利用云上算力。

3、一套语言,一个引擎,覆盖 Data + AI 的能力,开箱即用

企业在落地数据平台或者 AI 工程时,往往面临着选型难的问题,对于数据工程师来讲,更是需要了解、学习、开发和维护整个数据处理链路中的各个组件,上手成本和维护成本都很高。Byzer 希望能够提供一套语言、一个引擎,就能覆盖整个数据链路,同时可以提供各种算法、模型训练等开箱即用的能力。

 

Byzer 在 12 月 15 日正式发布了 Byzer 2.2.0 版本,欢迎大家试用和反馈。

 

IDE 支持 - Byzer Notebook

 

Byzer 作为一门语言,需要能够支持 IDE 或者文本编辑器,完成诸如代码高亮,代码提示,运行等能力。目前比较流行的方式是实现 LSP(Language Server Protocol),各类主流编辑器或者 IDE 就可以基于 LSP 的协议来实现相关的功能。Byzer 实现了 LSP 协议并提供了 code suggest API,用户可以自行开发相关的编辑器插件来支持 Byzer 开发。


Byzer Notebook是由 Kyligence 开发并贡献到社区的一个基于 Byzer 的 Web IDE。具备以下主要特性:

  • 拥有强大的交互编译能力,支持代码高亮、代码提示等功能;

  • 提供稳定可靠的数据工程能力,支持多数据源的表进表出和 AI 模型的训练与发布;

  • 支持 Notebook 和 Workflow 的形式给用户提供低代码、交互式编程的能力。

 

除了 Byzer Notebook 外,社区还开发了 Byzer 语言的 VSCode 插件,用户在 VSCode 中就可以编写运行 Byzer 代码了。

 

Byzer Notebook 在 12 月 15 日正式发布了 Byzer Notebook 1.0.0 版本,欢迎大家试用和反馈。

 

诚邀开发者共建社区

 

Byzer 社区作为一个新兴的开源社区,非常欢迎大家来参与和贡献。目前 Byzer 已经获得了不少生产客户,数据团队选用 Byzer 后仅需少量的开发人员就可以支撑整个数据平台,详情可以关注 Byzer 社区的 Meetup 活动以及官方公众号等渠道。



除了代码贡献外,社区也欢迎其他形式的参与,比如提 Feature Request、贡献文档、视频教学、编写博客,担任讲师,以及协助社区 Meetup 活动等,更多详情可以看如何贡献 Byzer 社区,期待和大家一起共建一个 Geek 且充满想象力的社区。


社区:https://github.com/byzer-org

官网:https://byzer.org/home

文档:https://docs.byzer.org

Roadmap:https://github.com/byzer-org/.github/blob/main/roadmap/2022h1.md

2021-12-21 14:556574

评论 4 条评论

发布
用户头像
碰瓷 MySQL
2022-01-05 14:22
回复
用户头像
这个 ML 是不是 HTML 中的那个意思? :P
2021-12-27 09:43
回复
用户头像
看成 MySQL 的肯定不止一个, 🤣
2021-12-24 23:59
回复
用户头像
看成MySQL了😂
2021-12-22 10:40
回复
没有更多了
发现更多内容

从源码角度详解Java的Callable接口

华为云开发者联盟

Java ide jdk Callable Callable接口

根据译文片段预测翻译作者

毛显新

tensorflow

架构实战营模块三作业

袁小芬

takin(全链路压测)快速安装-mac图文版

国隆

大数据 性能压测 生产环境全链路压测 takin 探针

第三届WICC圆满结束 融云打造技术与生态平台推动产业发展

融云 RongCloud

Java实战:教你如何进行数据库分库分表

华为云开发者联盟

Java 数据库 分布式 分库 分表

带你了解弯曲文本检测算法的两种思路:区域重组和像素分割

华为云开发者联盟

文字 目标检测算法 文本检测 区域重组 像素分割

TensorFlow 2 quickstart for experts

毛显新

tensorflow

架构实战营 - 模块三作业: 架构文档

Julian Chu

架构实战营

架构实战营 模块三 作业

脉醉

#架构实战营

如何实现支持百亿级文件的分布式文件存储

焱融科技

云计算 云原生 高性能 分布式存储 海量存储

4问教你搞定java中的ThreadLocal

华为云开发者联盟

Java 线程 多线程 ThreadLocal 变量

Go语言:RESTful API 服务,急速入门

微客鸟窝

Go 语言

【入门必读】《TcaplusDB数据库常见问题解决及诊断技巧集锦-数据库使用类-2》

TcaplusDB

nosql 腾讯 Data TcaplusDB

手写基数排序算法

实力程序员

程序员 C语言 排序算法

就想搞明白,component-scan 是怎么把Bean都注册到Spring容器的!

小傅哥

Java spring 小傅哥 bean注册

架构实战营模块四作业

老猎人

架构实战营

来也科技:RPA+AI的赋能者和布道者

海比研究院

没怎么写过 Java 的遗憾

escray

学习 极客时间 朱赟的技术管理课 7月日更

怎么在Guitar Pro乐谱中加入哇音

懒得勤快

汽车燃料效率预测

毛显新

tensorflow

【学习笔记】:使用Chrome浏览器的网络面板分析http请求

姬翔

架构实战营 模块 3作业 - 消息队列架构设计文档

Geek_8c5f9c

架构师训练

《TcaplusDB数据库常见问题解决及诊断技巧集锦-数据库使用类-3》

tcaplus

TcaplusDB

架构实战营 模块三作业

孫影

架构实战营 #架构实战营

架构实战营模块 3 课后作业

hello

架构师实战营

“运愁维卧”,决胜千里 | TcaplusDB7.24运维日致敬每一位运维人

TcaplusDB

nosql 腾讯 TcaplusDB

我花了 24 天使用 C++ 从零实现了一个解释器

lmymirror

interpreter compiler

云图说|云上应用监控神器——应用性能监控APM2.0

华为云开发者联盟

APM 华为云 云图说 应用性能管理 应用监控

架构训练营-学生管理系统详细架构文档

sophiahuxh

Python OpenCV 轮廓检测与轮廓特征,加图像金字塔知识补充一点点

梦想橡皮擦

Python 7月日更

MLSQL 正式更名Byzer ,全新开源社区同步上线_开源_Kyligence_InfoQ精选文章