网页
资讯
视频
图片
知道
文库
贴吧
地图
采购
进入贴吧
全吧搜索
吧内搜索
搜贴
搜人
进吧
搜标签
日
一
二
三
四
五
六
签到排名:今日本吧第
个签到,
本吧因你更精彩,明天继续来努力!
本吧签到人数:0
一键签到
成为超级会员,使用一键签到
一键签到
本月漏签
0
次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行
补签
。
连续签到:
天 累计签到:
天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
01月21日
漏签
0
天
云计算吧
关注:
31,329
贴子:
66,296
看贴
图片
吧主推荐
游戏
5
回复贴,共
1
页
<<返回云计算吧
>0< 加载中...
怎样进行大数据的入门级学习?
只看楼主
收藏
回复
meek小刚
云能手
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
从业三年聊点心得体会吧
meek小刚
云能手
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
数据科学并没有一个独立的学科体系,统计学,机器学习,数据挖掘,数据库,分布式计算,云计算,信息可视化等技术或方法来对付数据。但从狭义上来看,我认为数据科学就是解决三个问题:
江西依航票务有限公司
飞机票全国统一免费订票电话,飞机票,国内国际机票预订,儿童机票预订,儿童托管,老人托管,团队机票,证件信息更改,行李加购等。航协认证,专业有保障
2025-01-21 15:22
广告
立即查看
meek小刚
云能手
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
1. data pre-processing;
2. data interpretation;
3.data modeling and analysis.
meek小刚
云能手
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
这也就是我们做数据工作的三个大步骤:
1、原始数据要经过一连串收集、提取、清洗、整理等等的预处理过程,才能形成高质量的数据;
2、我们想看看数据“长什么样”,有什么特点和规律;
3、按照自己的需要,比如要对数据贴标签分类,或者预测,或者想要从大量复杂的数据中提取有价值的且不易发现的信息,都要对数据建模,得到output。
这三个步骤未必严谨,每个大步骤下面可能依问题的不同也会有不同的小步骤,但按我这几年的经验来看,按照这个大思路走,数据一般不会做跑偏。
meek小刚
云能手
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
这样看来,数据科学其实就是门复合型的技术,既然是技术就从编程语言谈起吧,为了简练,只说说R和Python。但既然是荐数据科学方面的书,我这里就不提R/Python编程基础之类的书了,直接上跟数据科学相关的。
meek小刚
云能手
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
今天有点累了,明天继续给你们更
登录百度账号
扫二维码下载贴吧客户端
下载贴吧APP
看高清直播、视频!
贴吧页面意见反馈
违规贴吧举报反馈通道
贴吧违规信息处理公示