0%

1 Modeling creation

经过前面的学习,已可以对数数据进行增删查补和清洗工作。接下来需要使用处理好的数据进行分析和建模。这一章要做的是运用数据来得到某些结果。

分析的第一步是搭建一个预测模型或者其他;根据模型的结果,可以分析该模型是否可靠。

Read more »

前文已经对数据分析的基本操作进行了学习,接下来要进行数据清洗、数据特征提取、数据重构以及数据可视化的学习。

1 Data cleaning

1.1 Load data

1
2
3
4
5
import numpy as np
import pandas as pd

df = pd.read_csv('./train.csv')
df.head(3)
Read more »

1 概述

这门课程得主要目的是通过真实的数据,以实战的方式了解数据分析的流程和熟悉数据分析python的基本操作。知道了课程的目的之后,我们接下来我们要正式的开始数据分析的实战教学,完成kaggle上泰坦尼克的任务,实战数据分析全流程。
这里有两份资料:
教材《Python for Data Analysis》和 baidu.com &
google.com(善用搜索引擎)

Read more »

1. Problem

1.1 Introduction of Background

火力发电的基本原理是:颜料燃烧时加热水会生成蒸汽,蒸汽压力推动汽轮机旋转,然后汽轮机带动带动发电机旋转,产生电能。在这一系列的能量转化中,影响发电效率的核心是锅炉的燃烧效率,即燃料燃烧加热水产生高温高压蒸汽。锅炉的燃烧效率的影响因素很多,包括锅炉的可调参数,如燃烧给量,一二次风,引风,返料风,给水水量;以及锅炉的工况,比如锅炉床温、床压,炉膛温度、压力,过热器的温度等。我们如何使用以上的信息,根据锅炉的工况,预测产生的蒸汽量,来为我国的工业届的产量预测贡献自己的一份力量呢?

Read more »

1. Problem

1.1 Introduction of background

幸福感是一个古老而深刻的话题,是人类世代追求的方向。与幸福感相关的因素成千上万,这些错综复杂的因素中,我们能找到其中的共性,一窥幸福感的要义吗?

Read more »

1. Introduction

Blending 集成方法的学习过程中,可以发现 Blending 在集成过程中只使用到了验证集的数据,这就造成了很大的浪费。因此可以靠用使用 Stacking 集成方法进行改进。

Read more »

1. Introduction

Blending 方法可以看是一个简化版的 Stacking 方法,blend 的中文意思是 “混合”,这就很好地诠释了 Blending 方法的思想 —— 不同模型的混合,也就是集成的本意。该方法仅在验证集中进行预测,如下为 Blending 的步骤:

Read more »

1 Pytorch brief

1.1 Create Tensor

  • empty

    1
    2
    import torch
    x1 = torch.empty(5, 3) # 构造未初始化的矩阵
  • rand

    1
    x2 = torch.rand(5, 3) # 构造随机初始化的正态分布矩阵
Read more »

1 Stata data operation

1.1 Data Operation

1.1.1 Browse data

  • browse / edit

    browse 用于打开或编辑数据浏览器,相当于单击数据浏览器或编辑按钮。命令格式:

    1
    browse/edit [varlist] [if] [in]
  • rename

    rename 用于对变量重新命名。格式:

    1
    rename (oldname) (newname)
Read more »

1 Recognize LaTeX\LaTeX

通过更换文档类型,可以正确显示中文。

Read more »