overview of mathworks
TRANSCRIPT
1© 2015 The MathWorks, Inc.
MATLAB机器学习和深度学习
卓金武MathWorks中国[email protected]
本讲义为论坛内部学习资料,版权归演讲者所有。转载请联系论坛管理员,感谢支持MATLAB中文论坛!
如需下载本次演讲的视频资料,请访问:http://www.ilovematlab.cn/thread-481503-1-1.html
2
机器学习
– 何为机器学习
– 机器学习的常见问题
– MATLAB机器学习技术
Example 1: 设备测试式维护的实现
Example 2: 量化投资
深度学习
– 深度学习Vs.机器学习
– 深度学习的技术实现
Example 3: 图像识别
总结
内容提要
3
机器学习的应用领域
图像识别
语音识别
股票预测
医学诊断
数据分析
机器人
等等…
[TBD]
4
何为机器学习
机器学习是用数据产生一个用于执行一个任务的程序
Standard Approach Machine Learning Approach
𝑚𝑜𝑑𝑒𝑙 = <𝑴𝒂𝒄𝒉𝒊𝒏𝒆𝑳𝒆𝒂𝒓𝒏𝒊𝒏𝒈𝑨𝒍𝒈𝒐𝒓𝒊𝒕𝒉𝒎
>(𝑠𝑒𝑛𝑠𝑜𝑟_𝑑𝑎𝑡𝑎, 𝑎𝑐𝑡𝑖𝑣𝑖𝑡𝑦)
Compute
r
Program
Machine
Learnin
g
𝑚𝑜𝑑𝑒𝑙: Inputs → OutputsHand Written Program Formula or Equation
If X_acc > 0.5
then “SITTING”
If Y_acc < 4 and Z_acc > 5
then “STANDING”
…
𝑌𝑎𝑐𝑡𝑖𝑣𝑖𝑡𝑦= 𝛽1𝑋𝑎𝑐𝑐 + 𝛽2𝑌𝑎𝑐𝑐+ 𝛽3𝑍𝑎𝑐𝑐 +
…
任务: 人类行为探测
5
现有数据
已知结果
模型l
训练模型
模型
新数据
预测结果
预测
模型评估
选择模型
导入数据
探索数据
数据
准备数据
加速计算
机器学习流程
6
机器学习算法分类
机器学习
有监督
分类
回归
无监督 聚类
Group and interpret data based only
on input data
Develop predictivemodel based on bothinput and output data
学习类型 算法类别
7
无监督学习
聚类
k-Means,
Fuzzy C-Means
Hierarchical
Neural Networks
Gaussian
Mixture
Hidden Markov
Model
8
回归
Non-linear Reg.
(GLM, Logistic)
Linear
RegressionDecision Trees
Ensemble
MethodsNeural Networks
分类
Nearest
Neighbor
Discriminant
AnalysisNaive Bayes
Support Vector
Machines
有监督学习
9
数据:数据取自100个同种型号发动机多个传感器的数据
工程背景:
执行计划式维护
依然有故障发生
已收集了故障记录以及这些故障发生前的传感器的数据
能预测出故障还有多久就会发生吗
Data provided by NASA PCoEhttp://ti.arc.nasa.gov/tech/dash/pcoe/prognostic-data-repository/
案例:涡轮发动机的预测性维护
10
?
His
tori
cal
Liv
e
Engine1
Engine2
Engine100
Initial Use/
Prior Maintenance
Time
(Flights)
Engine200
Recording Starts Failure Maintenance
?
?
?
?
数据是如何记录的
11
.exe .lib .dll
MATLAB
Compiler SDK
MATLAB
Compiler
MATLAB
Runtime
MATLAB Coder
部署模型到产品中
12
效果演示
13
增加可用时间和安全性 更可靠
降低维护成本 更经济
优化供应链管理 更出名
预测式维护的意义
14
目标:
训练股票聚类和分类模型
数据:
股票交易数据
方法:
– 提取有效特征
– 训练模型
– 用测试数据进行测试
数据点
数据点
层次聚类结果相关程度图
500 1000 1500 2000 2500 3000 3500 4000 4500
500
1000
1500
2000
2500
3000
3500
4000
4500
距离矩阵
:spearm
an
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
基于交易数据的量化择股
15
21111015172425 21828 7 8 6132230 1192312141627 326 920 4 529
0.5
0.6
0.7
0.8
0.9
1
数据点
距离
CPCC: 0.5406
股票的聚类结果——层次聚类 股票的分类模型——决策树
技术关键与结果
16
Steps Challenge Solution
获取、探索、分析数据 数据的多样性扩展数据支持
signal, images, financial, Textual,
geospatial, and several others formats
预处理数据 缺乏专业工具高质量数据预处理函数库
Industry-standard algorithms for Finance,
Statistics, Signal, Image processing
训练模型 周期长 可交互的APP操作流程Focus on machine learning, not programing
评估模型多种问题:
过度拟合速度-精度-复杂度
集成的最佳实践Model validation tools built into app
Rich documentation with step by step guidance
反复 灵活的架构更适合定制化的流程Complete machine learning platform
MATLAB在机器学习方面的优势和劣势
17
机器学习
– 何为机器学习
– 机器学习的常见问题
– MATLAB机器学习技术
Example 1: 设备测试式维护的实现
Example 2: 量化投资
深度学习
– 深度学习Vs.机器学习
– 深度学习的技术实现
Example 3: 图像识别
总结
内容提要
18
本质:通过构建多隐层的模型和海量训练数据,来学习更有用的特征,从而最终提升分类或预测的准确性。 “深度模型”是手段,“特征学习”是目的。
深度学习
19
神经网络 : 深度学习:
深度学习 vs. 神经网络
20
目标:
训练深度学习机
方法:
– 提取有效特征
– 训练深度学习模型
– 用测试数据进行测试
案例 : 基于深度学习的图像识别
21
技术关键与结果
22
机器学习
– 何为机器学习
– 机器学习的常见问题
– MATLAB机器学习技术
Example 1: 设备测试式维护的实现
Example 2: 量化投资
深度学习
– 深度学习Vs.机器学习
– 深度学习的技术实现
Example 3: 图像识别
总结
内容提要
23
机器学习的适应场景:
– 规则和方程太复杂时
脸谱、语音、模式识别….
– 规则和模型市场变化时
欺诈检测…
– 数据的特征市场变化并且程序需要适应这种变化时
自动交易、能耗预测、供水预测…
深度学习的适应场景:
– 规则和方程不容易表达,并且一般机器学习方法效果不
好时
股票预测、经济预测….
– 对准确度要求较高的大样本数据问题
指纹、图像识别…..
总结
24
What if Computational Thinking was Commonplace?
Science
STechnolog
y
TEngineerin
g
EArt
AMath
M
Foundation: Computational Thinking
Cross-collaboration
Integrated Curriculum Integrated Campus
25
MathWorks 大学合作计划
教学、科研资源共享 支持教师出版图书
正版授权, 包括校级、学院级、实验室.. 学生设计竞赛赞助
26
QS World University Rankings® for Engineering & Technology
(Top 50)
1 Massachusetts Institute of Technology (MIT)
2 Stanford University
3 University of Cambridge
4 National University of Singapore (NUS)
5 ETH Zurich - Swiss Federal Institute of
Technology
6 Nanyang Technological University, Singapore
(NTU)
7 Imperial College London
8 University of California, Berkeley (UCB)
9 University of Oxford
10 Harvard University
11 Tsinghua University12 The University of Tokyo
13 KAIST - Korea Advanced Institute of Science &
Technology
14 The Hong Kong University of Science and
Technology
15 Seoul National University
16 California Institute of Technology (Caltech)
17 Ecole Polytechnique Fédérale de Lausanne
(EPFL)
18 The University of Melbourne
19 Delft University of Technology
19 Georgia Institute of Technology
21 University of New South Wales (UNSW)
22 Tokyo Institute of Technology
23 University of California, Los Angeles (UCLA)
24 Politecnico di Milano
24 Princeton University
QS World University Rankings® for Engineering & Technology
(Top 50)
26 The University of Hong Kong
27 Peking University28 Kyoto University
29 Carnegie Mellon University
30 Technische Universität München
30 The University of Sydney
30 University of Illinois at Urbana-Champaign
33 Shanghai Jiao Tong University
34 Cornell University
34 National Taiwan University (NTU)
36 KTH Royal Institute of Technology
36 University of Michigan
38 University of Texas at Austin
39 Monash University
40 The University of Queensland
41 The Australian National University
41 Pohang University of Science And Technology
(POSTECH)
41 The Chinese University of Hong Kong (CUHK)
44 Indian Institute of Technology Delhi (IITD)
44 The Hong Kong Polytechnic University
46 Technical University of Denmark
47 Technische Universität Berlin
47 The University of Manchester
49 University of Toronto
50 UCL (University College London)
Top 50 universities with MATLAB Enabled Campus (TAH)
27
Some Regional universities with MATLAB Enabled Campus (TAH)
28
MATLAB Enabled Campus
“Everyone, Anytime, Anywhere” Access
– Standardize MATLAB Suite for All:
Faculty, Staff, and Students
50 product suite (MATLAB, Simulink + Toolboxes)
– Covers all on-campus facilities and home use (BYOD)
MATLAB Desktop: Self-serve, users obtain personal
standalone license
MATLAB Online: Access MATLAB with a web browser
MATLAB Mobile: Access MATLAB on iOS/Android devices
MATLAB ONPCsClustersCloud MATLAB Mobile
Scalable Computing Infrastructure
MATLAB Online
Unified Computational Ecosystem
29
更多学习资源
MATLAB 帮助
MathWorks 官网
MATLAB中文论坛
30
问题和讨论
官 网 : www.mathworks.cn
公司电话 : 010-59827000
邮 箱 : [email protected]
微信 / QQ : 70263215
手 机 : 13917258364
31© 2015 The MathWorks, Inc.
© 2016 The MathWorks, Inc. MATLAB and Simulink are registered trademarks of The MathWorks, Inc. See www.mathworks.com/trademarks for
a list of additional trademarks. Other product or brand names may be trademarks or registered trademarks of their respective holders.
本讲义为论坛内部学习资料,版权归演讲者所有。转载请联系论坛管理员,感谢支持MATLAB中文论坛!
如需下载本次演讲的视频资料,请访问:http://www.ilovematlab.cn/thread-481503-1-1.html