建模杂谈系列112 通用数据交换规范
2022/1/19 23:59:44
本文主要是介绍建模杂谈系列112 通用数据交换规范,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
说明
数字化转型必然面对的问题
说起来数字化转型已经被提倡了至少3年时间,从我的实际体会上存在以下困难:
- 1 由于技术发展过快,许多企业的管理人员无法理解,所以也不知道该怎么转型
- 2 过于“珍惜”数据,宁可放着不用也不打算用(长期来看,数据资产的质量是下降的,乃至不可用)
从某种程度上说,建模所需的数据恰恰是隐私无关
的。类似电话号码、身份证这样的数据,对模型一点用都没有。模型需要的是学习并提取通用的规律。
刚才还想着怎么解释,正好有一个Kaggle的竞赛有点兴趣,难道这不是一种很理想的方式吗?(企业出钱,整理好数据,让大家来做,选择做的好的)
10万美金,对一个企业来说,多吗?
内容
1 解耦
将数据维度和实际业务意义进行剥离
这一步比较简单,例如age
变量可以比较容易猜出业务
这篇关于建模杂谈系列112 通用数据交换规范的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-05-29DataGrip使用ssh连接数据库的操作流程
- 2024-05-28SpringBoot3.2更新声明!
- 2024-05-28中外程序员到底有啥区别?
- 2024-05-25外企也半夜发布上线吗?
- 2024-05-24鸿蒙原生应用再新丁!芒果TV 入局鸿蒙
- 2024-05-22基本概念
- 2024-05-22检索数据
- 2024-05-22排序数据
- 2024-05-22基础过滤数据
- 2024-05-22通过逻辑操作符过滤数据