建模杂谈系列112 通用数据交换规范

2022/1/19 23:59:44

本文主要是介绍建模杂谈系列112 通用数据交换规范,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

说明

数字化转型必然面对的问题

说起来数字化转型已经被提倡了至少3年时间,从我的实际体会上存在以下困难:

  • 1 由于技术发展过快,许多企业的管理人员无法理解,所以也不知道该怎么转型
  • 2 过于“珍惜”数据,宁可放着不用也不打算用(长期来看,数据资产的质量是下降的,乃至不可用)

从某种程度上说,建模所需的数据恰恰是隐私无关的。类似电话号码、身份证这样的数据,对模型一点用都没有。模型需要的是学习并提取通用的规律。

刚才还想着怎么解释,正好有一个Kaggle的竞赛有点兴趣,难道这不是一种很理想的方式吗?(企业出钱,整理好数据,让大家来做,选择做的好的)

在这里插入图片描述
10万美金,对一个企业来说,多吗?

内容

1 解耦

将数据维度和实际业务意义进行剥离

这一步比较简单,例如age 变量可以比较容易猜出业务



这篇关于建模杂谈系列112 通用数据交换规范的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!


扫一扫关注最新编程教程