数据分析简单步骤(实现路径):
1、数据获取(数据采集)
2、数据清洗
3、数据指标搭建
4、数据计算
5、数据可视化
6、预测及决策
(数据仓库、数据治理、数据产品化)
学习提纲:
1、通过Excel做简单的数据清洗
2、数据指标创建
3、通过Excel的公式做简单的数据计算
4、通过Excel做数据可视化
5、预测及决策
一、通过Excel做简单的数据清洗
1.1 交易日期:将字符串转换成正常日期
选中日期→设置单元格格式→日期格式(YYYY-MM-DD)→数据→分列→分隔符号(下一步)→Tab键(下一步)→日期(YMD)→完成
1.2 数据格式化:将数据统一转换成两位小数/4位小数
设置单元格格式→数值→2位/4位小数
二、数据指标创建
2.1 数据指标结构
数据指标分为原子指标和派生指标。何为原子指标?何为派生指标?
原子指标:基于某一业务时间行为下的度量,是业务定义中不可再拆分的指标,具有明确业务含义的名词。
原子指标=业务过程+度量
如,出借金额
派生指标:有原子指标延伸出来的指标,可以理解为原子指标业务统计范围的圈定。
派生指标=原子指标+修饰词+时间周期
如,原子指标为“出借金额”,“近7天V8等级用户出借金额”则为派生指标(近7天为时间周期,V8等级为修饰词,用户作为维度,而不作为修饰词)
2.2 创建数据指标
1、最高最低差:通过差值,了解是否有利可图
2、今高昨低差:根据实际交易的业务场景(国内股票市场,当天买进的股票当天不能卖出),昨天最低价买进,今天最高卖出,是否有利可图
3、平均值:用于预测最低最高值
4、最大值:用于预测最高值,卖出参考值
5、中位数:最高最低风险预测
6、最小值:用于预测最低值,买入参考值
7、众数:用于预测最低最高值出现的概率
三、通过Excel的公式做简单的数据计算
3.1 统计口径定义
1、最高最低差=最高价-最低价
2、今高昨低差=今天最高价-昨天最低价
3、平均值=当年价格总和/天数
4、最大值:当年价格中最高的值
5、中位数:当年价格中价格居中的值
6、最小值:当年价格中最小的值
7、众数:当年价格中,出现频率最多的值
3.2 Excel计算公式
1、最高最低差:=D2-E2
D2是当天最高价,E2是当天最低价
2、今高昨低差:=D2-E3
D2是当天最高价,E3是昨日最低价
3、平均值:=AVERAGE(C2:C129)
C2是最后一天的价格,C129是第一天的价格
4、最大值:=MAX(C2:C129)
C2是最后一天的价格,C129是第一天的价格
5、中位数:=MEDIAN(C2:C129)
C2是最后一天的价格,C129是第一天的价格
6、最小值:=MIN(C2:C129)
C2是最后一天的价格,C129是第一天的价格
7、众数:=MODE(C2:C129)
C2是最后一天的价格,C129是第一天的价格
四、通过Excel做数据可视化
4.1 最高最低价趋势图
了解最高价、最低价的增长趋势。
4.2 今高昨低差趋势图
了解可盈利的空间。
4.3 最高最低价散点图
了解最高价格、最低价格主要集中在哪些范围。
4.4 开盘收盘价趋势图
了解开盘价格和收盘价格的规律。
五、预测及决策
5.1 可盈利空间分析——要不要投资
5.1.1 今高昨低差分析
比亚迪股票最高最低差相差较大,有较大的盈利空间,值得投资
5.1.2 价格增长趋势分析
比亚迪价格趋势上涨,价格还可能继续增长,因此,具有投资价值。
5.2 最高最低价预测——如何获利
1、看整体数据:了解大体情况
2、看最近数据:看趋势,相当于加入参考系数,给后续投资做打分预测
平均最高价:273.33(卖出参考价格)
平均最低价:262.55(买进参考价格)
最大最高价:358.86(在这个价格左右,可考虑卖出)
最大最低价:348.33(大于该值时,谨慎买入)
最小最高价:222.00(小于该值时,谨慎卖出)
最小最低价:209.43(在这个价格左右,可考虑买进)
最高价中位数:252.08(卖出预警价格)
最低价中位数:243.98(买进预警价格)
最高价众数:340.60(卖出参考价格)
最低价众数:338.00(买进参考价格)
买进参考价:
最小最低价:209.43
最低价众数:338.00
最低价中位数:243.98
平均最低价:262.55
最大最低价:348.33
卖出参考价:
最大最高价:358.86
最高价中位数:252.08
最高价众数:340.60
平均最高价:273.33
最小最高价:222.00
本内容仅用于数据分析学习,不作股票投资参考。
评论 (0)