NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

Wolfram|Alpha,菱形六十面体背后的细节

  • 2009-05-25
  • 本文字数:1547 字

    阅读完需:约 5 分钟

Wolfram|Alpha 尝试用符号计算使世界上的系统知识变得可计算。它的输入不是一组方程,而是语言。该系统的主要部分包括一个数据整理(data curation)管道,一个算法计算系统、一个语言学处理系统,还有一个自动化的呈现系统。

Wolfram|Alpha 并不是那种返回已有网页的链接的搜索引擎,也不是像 Wikipedia 那样提供“大众化”知识叙述的海洋。它的目标是通过对提供给它的事实进行实时计算,去回答用户提出的问题。

Wolfram|Alpha 不靠搜索 Web 来找答案,它的源数据也并非来自 Web。它内部所用的数据经过整理和审核,大部分来自系统化的第一手来源。即使是实时数据(天气、股票、地震)也经过整理,并与有效数据作比较,如果发现偏差,就会特别标示出来(比如用虚线)。

Wolfram|Alpha 用了“超过 10T 的数据,超过 5 万种算法和模型,还具有超过 1 千个领域的语言学处理能力”。作为 Wolfram|Alpha 引擎基础的 Mathematica 引擎从 1986 年开始持续发展,现在已经有超过 5 百万行的符号代码,运行在世界排名第 66 位的超级计算机上,每天可处理 1.75 亿条请求。服务由 R Systems 提供,可以每秒执行 39.6T 条数学运算,细节如下:

据 Top500 网站和 Dell 一份关于此系统的案例研究( PDF )所说,系统名为 R Smarr ,有 4,608 个处理器核心,用了 576 台“Harpertown” Xeon 机器,共 65,536GB 内存,采用高速的 InfiniBand 数据传输连接。该系统同时使用了 Red Hat Enterprise Linux 和 Microsoft Windows HPC Server 两种操作系统。

Wolfram Research 说,处理 Alpha 请求的将是位于同一地点的 5 套设备。项目中实际上包括两台超级计算机,合起来将近 10,000 个处理器核心以及数百 T 的硬盘。

数据通过统一的 Mathematica 语言接口以及一种按需加载机制取得,取回的数据表示成 Mathematica 表达式,这是一种 S-expressions (符号表达式)。它的大量数据涵盖了很多领域:“数学、物理、化学、天文、地理、语言学、金融等等。”据作者所说,Wolfram|Alpha 和 Mathematica 两种技术的区别在于:

Wolfram|Alpha 在 Web 界面上给出简短、快速、一次性的结果。_Mathematica_ 是一个更深更广的计算环境,用户可以处理任意类型的复杂问题。对 Wolfram|Alpha 和 _Mathematica_ 的扩展会使两者联系得更紧密。

目前 Wolfram|Alpha 的输入语言是英语,但计划未来支持其他语言。用户输入的的歧义性是这样解决的:

它将各种可能的理解作高低排列,然后对它认为最有可能的理解给出答案,并给出其他理解的答案链接。它在排列的时候还会考虑你所在的地理位置——比如离你较近的城市排位会较高。

地理位置根据用户的 IP 地址得出,数据来自 GeoIP ,精度为 5 英里。

每位用户分得的处理时间有限制。如果过了时限而请求还没处理完,它会返回部分的结果。计划中的 Wolfram|Alpha 专业版将没有计算时限列为特性之一。专业版的其他特性还有:

  • 可下载多种格式(例如电子表格、XML、3D 模型、TeX 等等。)

  • 可上传要分析的数据(例如电子表格、文字、图片、网页等等。)

  • 多种可选的显示格式

  • 保存个人或企业的偏好设置

  • 可存储实体定义

  • 动态交互能力

  • 会话历史

Wolfram 未来还有更多计划:“提供给开发者的APIs 专业版和企业版针对内部数据的定制版连接其他形式的内容部署到移动平台等新兴平台。”

以下是使用Wolfram|Alpha 的一个例子,查询“Hurricane Katrina”会得到以下结果:

每个带标题的段落被称为“pod”,其下又可以有“sub-pod”。在查询结果的底部还有信息来源的连接,以及将结果保存为PDF 格式的选项。

Wolfram|Alpha 的标志是一个菱形六十面体( rhombic hexecontahedron )。

最后为您提供一些有用的链接: Wolfram|Alpha 博客(提供最新消息)社区网站参与者网站(反馈、贡献、建议等)

查看英文原文: Wolfram|Alpha, the Details Behind the Rhombic Hexecontahedron

2009-05-25 03:462755
用户头像

发布了 225 篇内容, 共 61.0 次阅读, 收获喜欢 50 次。

关注

评论

发布
暂无评论
发现更多内容

数据驱动科研,清华大学中国新型城镇化研究院使用 ModelWhale 云端协同创新平台

ModelWhale

人工智能 新基建 云平台 数据科学 学科交叉

袋鼠云陈吉平:深耕国产自研数字化技术与服务,持续为客户创造价值

袋鼠云数栈

【愚公系列】2022年11月 微信小程序-app.json配置属性之entryPagePath

愚公搬代码

11月月更

3分钟快速掌握Go语言正/反向代理的姿势

有态度的马甲

Verilog语法之测试文件

智趣匠

Verilog 11月月更 测试文件

Cox 比例风险回归模型

heart_6662

11月月更 cox 生存分析 生物信息学

如何做好线上服务质量保障?

老张

软件测试 质量保障

CSS学习

Studying_swz

CSS 前端 11月月更

应对大规模的资产扫描一些小Tips

穿过生命散发芬芳

11月月更 资产扫描

Vue自定义指令(一)初识

Augus

vuejs 11月月更

HTML5学习

Studying_swz

html 前端 11月月更

前端食堂技术周刊第 58 期:TypeScript 4.9 RC、10 月登陆浏览器的新功能、Turbopack 真的比 Vite 快 10 倍吗?100 天 Modern CSS 挑战

童欧巴

typescript chrome

数据湖(二十):Flink兼容Iceberg目前不足和Iceberg与Hudi对比

Lansonli

数据湖 11月月更

docker-compose下的java应用启动顺序两部曲之二:实战

程序员欣宸

Docker Docker-compose 11月月更

vue_Promise学习

Studying_swz

前端 11月月更

数据库的体系结构

阿泽🧸

数据库 11月月更

DevOps|乱谈开源社区、开源项目与企业内部开源

laofo

DevOps 研发效能 工程效率

2022-11-07:给你一个 n 个节点的 有向图 ,节点编号为 0 到 n - 1 ,其中每个节点 至多 有一条出边。 图用一个大小为 n 下标从 0 开始的数组 edges 表示, 节点 i 到

福大大架构师每日一题

算法 rust 福大大

深入理解Metrics(一):Gauges

冰心的小屋

Java metrics Guages

算法题学习---链表中的节点每k个一组

桑榆

算法题 11月月更

计算机网络:随机访问介质访问控制之ALOHA协议

timerring

计算机网络 11月月更 ALOHA

阿里云丁宇:云原生激活应用构建新范式,Serverless奇点已来

阿里巴巴云原生

阿里云 Serverless 容器 RocketMQ 云原生

CSS学习笔记(一)

lxmoe

CSS 前端 学习笔记 11月月更

【炫丽】从0开始做一个WPF+Blazor对话小程序

沙漠尽头的狼

随机森林-机器学习中调参的基本思想

烧灯续昼2002

Python 机器学习 算法 随机森林 11月月更

Spring Boot「25」外部配置元数据

Samson

Java spring 学习笔记 spring-boot 11月月更

联通DataOps和MLOps:将机器学习推理作为新的数据源

Baihai IDP

人工智能 大数据 AI DataOps MLOps

发力新市民圈层,银行系消费金融这半年都有哪些行动?

易观分析

金融 银行

一年经验年初被裁面试1月有余无果,还遭前阿里面试官狂问八股,人麻了

程序员小毕

Java spring 程序员 面试 程序人生

设计千万级学生管理系统的考试试卷存储方案

第四次工业革命的“知识力”,流淌在百度这条创新流水线上

脑极体

Wolfram|Alpha,菱形六十面体背后的细节_方法论_Abel Avram_InfoQ精选文章