首页专栏详情
打赏
基于数据的决策:使用数据库内机器学习预测未来
基于数据的决策:使用数据库内机器学习预测未来
易百纳技术社区 圈圈 2023-01-24 00:00:00

在短短几年时间里,机器学习(ML)已经成为公司在其业务的几乎每个方面都部署的一项基本技术。ML市场以前是财大气大的大型机构的领地,现在正在迅速开放。每一种业务现在都可以利用ML来减少重复的手工流程,自动化决策,并预测未来的趋势。在任何业务任务的几乎每个阶段,ML都在使流程更智能、更精简、更快速。

近年来,技术进步通过减少获得ML驱动预测所需的时间、技能水平和步骤数量,帮助实现了ML的民主化,并推动了ML的采用。全球ML市场增长如此之快,预计将从2022年的210亿美元扩大到2029年的2090亿美元。声明式ML和AutoML等工具正在帮助企业访问强大的、业务关键型预测分析。将这些方法进一步推进,开源数据库内ML是一种正在获得发展的新技术。它允许企业轻松地向数据提出问题,并使用标准SQL查询快速获得答案。

什么是数据库内 ML?

传统上,构建 ML 模型是一项高技能、漫长、资源密集型的工作。ML 计划的典型时间范围以月为单位。项目花费超过六个月的时间并不罕见,需要大量时间用于从数据库中提取、清理和准备数据。

相比之下,开源数据库内 ML 将分析引入数据库,使企业能够获得您期望从传统的完全自定义 ML 模型中获得的那种见解,但存在一些重要差异。数据库内 ML 可以更快地(几天或几周,而不是几个月)获得这些结果,因为数据永远不需要离开数据库。另一个区别是,数据库内建模是使用常规的、现有的数据库技能(如SQL)完成的,这使得更广泛的IT团队更容易处理它。

虽然这是一个相对较新的领域,但它现在是GitHub明星代言的ML增长最快的部分。事实上,现在所有主要数据库供应商、ML 框架、BI 工具和笔记本都有数据库内 ML 集成。

企业如何使用数据库内 ML?

从人力资源到营销,从销售到生产,每个业务领域的用例都在帮助公司磨练客户体验,改善产品个性化,优化客户生命周期价值,提高员工保留率,更准确地评估风险,并提高工作场所的生产力。

以生产力软件领域的一个例子为例:Rize,一个智能时间跟 踪器,使用户在工作中更加富有成效和效率,使用数据库内ML开发了一个强大的功能,以在几周内响应用户反馈。由此产生的功能(由 ML 生成的见解驱动)提高了客户保留率和转化率。它还帮助Rize在竞争激烈的市场中脱颖而出,巩固了其作为真正智能时间跟 踪器的地位。

数据库内 ML 重塑行业的速度和规模

虽然其中许多用例使企业受益,无论行业或位置如何,但特定的行业应用程序正在出现,这些应用程序实时提供未来的洞察力,建立成本仅为传统ML算法的一小部分,并开始破坏这些市场中的现有价值链。

金融部门 - 一个快速实施传统ML建模的行业 - 现在正在转向数据库内建模以提高敏捷性。金融服务和金融科技公司正在使用数据库内 ML 来检测欺诈、帮助贷款回收、改善信用评分和批准贷款。因此,他们能够更快地对市场状况做出反应,调整他们提供的服务,甚至开辟新的收入来源。

例如,下一代多户房租支付处理平台 Domuso 使用数据库内 ML 每年节省 500,000 美元。 Domuso 训练并部署了一个数据库内 ML 模型,以准确预测租金是否可能因资金不足而退还。“借助数据库内ML,我们可以更快地实现高级模型,并降低复杂性,”Domuso当时的产品和运营执行副总裁Sameer Nayyar说。“这对我们的业务产生了积极影响。我们看到退款在两个月内减少了 95,000 美元,第一年节省了 500,000 美元。此外,随着新用例的出现,Domuso 现在能够在几周内创建和实施新的 ML 模型,而不是几个月。

零售、快速消费品和食品生产等行业已经迅速实现了数据库内建模的实时预测,帮助他们通过“及时”和特定于位置的优惠来应对市场状况。管理库存、预测特定物品的需求、优化人员配备水平以及预测未来定价只是零售和其他企业如何转向数据库内 ML 算法以应对日常挑战的几个例子。

以Journey Foods为例,这是一个用于食品开发和创新的供应链和食品科学软件平台,它使用数据库内ML来应对不断变化的原料价格的挑战。他们希望利用其包含 22,000 家供应商的 130,000 种食品成分的数据库,在 1 个月、3 个月、6 个月和 12 个月内为客户预测食品成本。由于成分和供应商总是在变化,他们担心绘制这些复杂的“多对多”关系所需的预测分析将非常耗时,并且需要持续的维护和重新培训。Journey Foods 求助于数据库内 ML 来开发其成本预测模型,从而对食品成分进行高精度预测。这也导致运营成本显着降低于他们最初考虑的本土ML模型。

提高业务敏捷性和创新能力

还有更多行业特定的例子,但推动这种快速增长的开源运动的共同因素是速度和规模。数据库内 ML 为任何拥有数据库的企业提供复杂的预测分析。

例如,在最近的开源数据库内ML黑客马拉松Hacktoberfest上,不断增长的数据库内ML程序员社区恰如其分地展示了创新的潜力。在活动过程中,团队提交了20多个新的数据库处理程序,包括与Apache Impala和Solr,PlanetScale和Teradata的连接,以及10多个新的机器学习处理程序,包括PyCaret,Ray Server和Salesforce。

数据库内分析仍处于早期阶段。就像更广泛的AI行业一样,ML细分市场对炒作并不陌生。然而,由于对复杂问题的快速回答不再只是理论上的可能,而是可以在短期内由各种规模和预算的企业实现,数据库内ML值得认真考虑。缩短构建模型所需的时间,并使没有数据科学背景的人能够运行项目,从而大大降低了与预测分析相关的成本。基于数据的决策为企业提供了传统 ML 技术的可行替代方案:快速、大规模地提供完全可定制的预测功能。


声明:本文内容由易百纳平台入驻作者撰写,文章观点仅代表作者本人,不代表易百纳立场。如有内容侵权或者其他问题,请联系本站进行删除。

162
收藏
点赞
打赏
给作者打赏,鼓励他抓紧创作吧~
评论
0个
内容存在敏感词
相关专栏
打赏作者
易百纳技术社区
圈圈
您的支持将鼓励我继续创作!
打赏金额:
¥1 易百纳技术社区
¥5 易百纳技术社区
¥10 易百纳技术社区
¥50 易百纳技术社区
¥100 易百纳技术社区
支付方式:
微信支付
支付宝支付
易百纳技术社区 微信支付
易百纳技术社区
打赏成功!

感谢您的打赏,如若您也想被打赏,可前往 发表专栏 哦~

审核成功

发布时间设置
发布时间:
是否关联周任务-专栏模块

审核失败

失败原因
备注
Loading...
易百纳技术社区
确定要删除此文章、专栏、评论吗?
确定
取消
易百纳技术社区
易百纳技术社区
在专栏模块发布专栏,可获得其他E友的打赏
易百纳技术社区
回答悬赏问答,被题主采纳后即可获得悬赏金
易百纳技术社区
在上传资料时,有价值的资料可设置为付费资源
易百纳技术社区
达到一定金额,收益即可提现~
收益也可用来充值ebc,下载资料、兑换礼品更容易
易百纳技术社区
活动规则
  • 1.周任务为周期性任务,每周周一00:00刷新,上周完成的任务不会累计到本周,本周需要从头开始任务,当前任务完成后才可以完成下一个任务
  • 2.发布的专栏与资料需要与平台的板块有相关性,禁止注水,专栏/资料任务以审核通过的篇数为准
  • 3.任务完成后,现金奖励直接打款到微信账户;EBC/收益将自动发放到个人账户,可前往“我的钱包”查看;其他奖励请联系客服兑换
  • 4.每周最后三个任务将会有以下奖品掉落:社区热卖开发板、小米音响、视频年度会员、京东卡、华为手机等等
易百纳技术社区
升级提醒
易百纳技术社区

恭喜您由入门

社区送出礼品一份

请填写您的收件地址,礼品将在3个工作日寄出

易百纳技术社区