我爬取交通学博士付费的GIS资源,每年被动收入2w很简单?

2021/8/6 6:08:17

本文主要是介绍我爬取交通学博士付费的GIS资源,每年被动收入2w很简单?,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

目录

1.背景介绍

2.技术路线

3.数据结果

4.数据分析

5.总结

6.后记

1.背景介绍

某周末闲来无事,顺手打开了CSDN,看到了一个人发布的收费GIS资源,售价是¥19.9,POI数据也有人买吗?这些都是免费的啊,打开了博主的主页。看到她上传的资源数量,被吓到了:

alt

这个博主,一共上传了8900个文件?我随意点开了她的一个资源,发现都是几个浏览,0下载:
alt
这位博士师姐不是白费劲吗?
不对!
天下熙熙,皆为利来;天下攘攘,皆为利往。
如果不赚钱,也不至于上传这么多啊?何况她是一位博士,不至于浪费自己的时间。
我想弄明白,她能从这里面到底获利多少?付出的时间是否和收益成正比?
因此我写了几个python脚本,用以回答上诉两个问题。

2.技术路线

在这个爬虫中,使用到的环境与工具有:Python3.6、notepad++、BeautifulSoup模块包。唯一需要用到的外部模块包是BeautifulSoup,这是一个网页分析工具,可以准确提取网页标签。其他的都是Python内置的函数。
整体的技术路线图如下所示:
alt
在进行编程中,需要注意的三个技术难点:
1.CSDN的个人主页资源介绍是一个瀑布流网页,最多加载100个list,因此需要找到该瀑布流网页的规律;
2.CSDN网页有反爬机制,因此需要频繁更换浏览器标识,;
3.几千个网线,使用多线程函数,比如700个线程同时爬;
上面是大致的思路,详细的技术流程与代码,我会分享在下一篇博客中。

3.数据结果

通过爬虫,我最后得到了所有网页。我选取的时间段是2020/11/24-2021/7/12,累计是7700个资源详细信息。整理得到的资源由:数据名称、资源类型、数据大小、数据浏览量、数据下载量、单价、总价、浏览下载比
alt

4.数据分析

待数据清洗完毕后,我迫不及待的计算了一下7700个文件,
一共赚了多少:17670.99元。
好像也不是很多吧?这可是7700个资源啊,多费时间,看起来不值得。待我继续往下分析,就觉得很值。

(1)上传文件名称云图

一共是两个云图,
第一个是名称没有数据清洗的云图:

第二个是名称经过数据清洗的云图:

主观看上去,都是地信、交通类的资源,免费获取大部分都可以做到。

(2)上传文件定价

根据7700个资源进行单价分析,制作了定价频率图,如下所示:
alt
可以看到,大部分定价都是14.9,是比较亲民的价格,对于不擅长找资源的顾客,花这点钱,真的很经济。

(3)浏览量与下载量

alt
博主一共上传了7700个文件,其中,有下载的只占7.4%,可转化率是比较低的。

(4)上传时间分析

我们来看看这位博主,喜欢什么时候上传文件:
alt
都是工作日的下午,正是上班的时候。除了学生,应该也没人会有空余时间。下面是上传天数分析,就很有意思了。为什么,请往下看:

alt

从2020年11月24日开始上传文件,到2021年7月12日,总共只花费了15天时间。相当于每一天净赚1000元,而且这个是被动收入。以后即使不做任何事,每年都有2w左右的收入。

5.总结

结论:
1.花费了共计15天,每天下午上传资源,获得了每年不少于2W的被动收入(往后即使不做任何事情),这个很值!
2.你所知道的免费资源,别人不一定知道,即使是收智商税,也是方便了大家。
3.作为学地信的学生,之前没有想到这么轻松的赚钱方式,汗颜。
讨论:
1.我统计的博主投入时间,只是上传时间,实际上找资源的时间可能更多。
2.这个博主也不是普通人,即使发布的资源大部分是网上可以找到的免费资源,但是能上传到快1W个资源了,这份耐心让人敬佩。这一份恒心,不管去哪都能赚到钱。

6.后记

我和这个博主加上微信了,她给我说:
alt
alt
1.她不是学生(我猜应该是国企或者事业单位吧,工作日上传资源,普通的996没有这么闲);
2.做资源上传,很累人;
3.网站会抽成,而且还得交税,到手大概是50%左右。
不管怎么说,她始终方便了别人,也方便了自己。希望大家都能找到合法合理的生财之道。

欢迎关注公众号:锐多宝的地理空间;

alt



这篇关于我爬取交通学博士付费的GIS资源,每年被动收入2w很简单?的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!


扫一扫关注最新编程教程