过去几年,数据湖经历了相当强劲的复苏,尤其是 云数据湖和数据湖 云数据湖。随着越来越多的企业将其数据基础设施迁移到云中,以及开源项目的增加推动云数据湖的创新,这些数据湖将在 2021 年继续受到关注。同样,数据湖屋(一种兼具数据湖和数据仓库属性的架构)在 2020 年获得了关注,并将在 云数据湖和数据湖 2021 年继续受到关注。随着数据库解决方案逐步迁移到云中,云数据仓库工程将成为特别关注的焦点。
我们将看到云原生分布式数据框架的浪潮
数据科学Hadoop 和其庞大的生态系统伴随 Hadoop 一起成长。Hadoop 现在可 手机数据 以被视为遗留系统,因为势头已经转向 Spark,而 Spark 目前像 Hadoop 过去一样占据主导地位。但也有新来者挑战者。Ray 和 Dask 等分布式计算框架更加灵活,并且是云原生的,这意味着 Nan [[未知]] 业主,首席经纪人 它们可以非常轻松地将工作负载迁移到云中。两者都实现了强劲增长,时间将告诉我们下一个平台是什么。
自然语言处理(NLP)将取得重大进展
去年,人工智能领域最令人兴奋的发展是 GPT-3,它能够生成听起来几乎像人类的散文。这将在 2021 年带来什么?可能性很多,从交互式助手和自动化客户服务到自动化假新闻。仔细研究 GPT-3,在新的一年开始时,我们应该考虑一些大问题。由于 GPT-3 是通过 API 交付 所 澳大利亚电话号码 欲 的(而不是通过将模型直接合并到应用程序中),“语言即服务”会是未来吗?虽然 GPT-3 擅长创建英文文本,但没有常识或事实的概念,那么更复杂的语言模型如何克服这些限制?例如,GPT-3 建议自杀作为治疗抑郁症的方法——这样的误解可能会带来巨大的、意想不到的挑战。