加入
我们
投稿
反馈
评论 返回
顶部

内容字号: 默认 大号超大号

段落设置: 段首缩进取消段首缩进

字体设置:切换到微软雅黑切换到宋体

GPU驱动的数据库可以为您做什么

2018-12-26 08:56 出处:未知 人气: 评论(

  SQL数据库可以追溯到20世纪70年代,自20世纪80年代以来一直是ANSI标准,但这并不意味着该技术仍处于静止状态。它仍然在变化,并且是GPU加速数据库的其中一种方式。

  图形处理器(英语:graphics processing unit,缩写:GPU),又称显示核心,视觉处理器,显示晶片或绘图晶片,是一种专门在个人电脑,工作站,游戏机和一些行动装置(如平板电脑,智慧型手机等)上执行绘图运算工作的微处理器。图形处理器使显示卡减少对中央处理器(CPU)的依赖,并分担部分原本是由中央处理器所担当的工作,尤其是在进行三维绘图运算时,功效更加明显。

  关系数据库的大小已经增长到以PB级甚至更高的数据集。即使64位计算和TB级内存的出现增加了处理能力,这仍然需要大量数据才能解决 - 而CPU只能管理这么多。这就是GPU进入的地方。

  而GPU已经从最初的加速游戏任务转变为加速几乎所有事情。 Nvidia已经巧妙地转向成为人工智能的代名词,这个过程需要并行处理大量数据,并且其他任务可以很好地并行化。 AMD正在开始追赶,但Nvidia有很长的领先优势。

  说到核心,它甚至都不是很接近。 Xeon CPU最多有22个核心。 AMD Epyc有32个核心。 Nvidia Volta架构拥有5,120个核心。现在想象一下5000多个内核并行运行数据,很清楚为什么GPU在大型计算项目中变得如此受欢迎。

  因此,出现了一类新的数据库,从头开始编写,以支持和拥抱GPU及其大规模并行处理功能。这些数据库支持新级别的数据处理,分析和实时大数据,因为它们可以处理常规CPU驱动的数据库根本无法处理的数据集。

  在这方面,GPU数据库并不真正与Oracle,SQL Server或DB2竞争。 GPU数据库面向制定数据分析决策,公司正在尝试从大量数据中实时做出决策,但由于数据太多或者视觉分析工具太慢,他们发现自己无法做到这一点。

  GPU数据库供应商并不认为自己可以替代Oracle或像Teradata这样的OLTP数据库。 GPU数据库不是针对传统的RDBMS工作负载,而是针对OLAP / OLTP世界和大数据,数据集庞大且需求是实时的。 GPU数据库可以实时或按小时显示数据,而不是批处理过程运行数小时或过夜。

  GPU数据库应解决NoSQL试图解决的许多问题,但允许您使用现有的结构化查询工具。使用NoSQL意味着重写所有SQL工具,但GPU数据库使用现有的SQL工具。

  “我们认为我们将会看到人们意识到他们可以做多维系统并从多个场景中获取数据并将其结合起来,”Datatrend Technologies的新兴技术解决方案架构师Steve Worthington说道,他是一家使用GPU数据库SQream的IT咨询公司。 “医疗公司希望从多个系统中获取[数据],并跨数据库进行分析,因为之前它们不能进行交叉引用,也没有任何方法可以加入数据库。”它还引用金融机构进行欺诈和风险分析,现在可能只是进行信用卡检查,但希望对多个账户进行检查。借助GPU的强大功能,他们可以同时跨所有这些信息源进行交叉引用。

  对于位置服务提供商Skyhook的地理空间数据副总裁Rich Sutton来说,使用OmniSci GPU数据库为他提供了比使用基于CPU的数据库更大的地理数据集可视化。 “我可以在OmniSci中加载十亿行,几乎没有延迟,而不必在传统的CPU空间中查看10,000行的数据集,”他说。 “这对我来说有利于减少数据消耗,延迟大幅减少。”

  OmniSci首席执行官Todd Mostak表示,一位客户告诉他,OmniSci的速度“降低了好奇心的成本。他们提出了他们之前会拒绝的问题。“一位金融服务客户告诉他,传统数据库上的18小时处理查询时间已经下降到亚秒级,而电信公司告诉他,现在需要花费数小时才能运行的查询会在第二。

  GPU数据库的另一个地方是实时大数据,其中Hadoop已经不足。 GPU数据库提供商SQream的首席执行官Ami Gal表示,在Hadoop上没有实现大数据发现所有存在于数十亿行数据中的机会的承诺,因为它太慢了。

  “Spark非常适合数据移动和转换,但是一旦你需要处理大量数据并移动它们,你就会开始处理成千上万的[计算]节点,这在大型数据集中被认为太多了。但是,如果你可以用10或15个节点来做,那就更有效了,“他说。

  Worthington表示,基于GPU的服务器可以在一个机柜中完成,这需要许多机柜价值的CPU供电的多并行处理(MPP)节点。 “我们可以用六个节点替换MPP节点的机架,每个节点有两到四个GPU。 有了这个,我们可以用不到100万美元的投资取代1000万美元的投资,“他说。

  GPU对Skyhook也很重要,Skyhook可以对大型地理数据集进行可视化。 “如果你在现场拥有一百万台设备并且每分钟几次点击位置,那么你每天都在谈论20亿个数据行。 这在传统数据库中是不可能消费的。 这是不可能的。 因此,GPU数据库将您带到可以使用该数据的位置,“Sutton说。返回搜狐,查看更多

分享给小伙伴们:
本文标签: 数据库结构

更多文章

相关文章

评论

发表评论愿您的每句评论,都能给大家的生活添色彩,带来共鸣,带来思索,带来快乐。


Copyright © 2002-2011 DEDECMS. IT之家 版权所有 Power by DedeCms