sparse factor analysis for learning analytics

Sparse Factor Analysis for Learning Analytics Andrew Waters, Andrew Lan, Christoph Studer, Richard Baraniuk Rice University

Upload: duscha

Post on 23-Mar-2016

36 views

Category:

Documents

0 download

Report

Download

Tags:

Embed Size (px):

DESCRIPTION

Sparse Factor Analysis for Learning Analytics. Andrew Waters, Andrew Lan , Christoph Studer, Richard Baraniuk Rice University. L earning C hallenges. P oor access to high-quality materials ($). O ne -size-fits-all. Inefficient,Slow feedback unpersonalized cycle. - PowerPoint PPT Presentation

TRANSCRIPT

Sparse Factor Analysis for Learning Analytics

Andrew Waters, Andrew Lan, Christoph Studer, Richard Baraniuk

Rice University

Page 2: Sparse Factor Analysis for Learning Analytics

Learning ChallengesPoor access to high-quality materials ($)One-size-fits-all

Inefficient,Slow feedback

unpersonalizedcycle

Page 3: Sparse Factor Analysis for Learning Analytics

Personalized Learning

Adaptation– to each student’s background,

context, abilities, goals

Closed-loop– tools for instructors and students

to monitor and track their progress

Cognitively informed– leverage latest findings from the

science of learning

Automated– Do this automatically data

Data (massive, rich, personal)

Page 4: Sparse Factor Analysis for Learning Analytics

Jointly Assess Students and Content

Latent factor decomposition (K concepts):

• Which concepts interact with which questions• How important is each concept for each question• Which questions are easy / difficult• How well have students mastered each concept

Do this solely from binary Q/A (possibly incomplete) data

Page 5: Sparse Factor Analysis for Learning Analytics

Statistical Model

Intrinsic difficultyof Question i

Concept weight for Question i

Concept mastery of Student j

Inverse link function (probit/logit)

Partially observed data

Page 6: Sparse Factor Analysis for Learning Analytics

Model Assumptions

Model is grossly undetermined

We make some reasonable assumptions to make it tractable:

- low-dimensionality

- questions depend on few concepts

- non-negativity

• SPARse Factor Analysis (SPARFA) model• We develop two algorithms to fit the SPARFA model to data

Page 7: Sparse Factor Analysis for Learning Analytics

SPARFA-M: Convex Optimization

Maximize log-likelihood function

• Use alternate optimization with FISTA [Beck & Teboulle ‘09] for each subproblem

• Bi-convex: SPARFA-M provably converges to local minimum

Page 8: Sparse Factor Analysis for Learning Analytics

SPARFA-B: Bayesian Latent Model

Z Yμ

Sparsity Priors:

Key Posteriors:

Use MCMC to sample posteriors

Efficient Gibbs’ Sampling

Assume probit link function

Page 9: Sparse Factor Analysis for Learning Analytics

Ex: Math Test on Mechanical Turk

High School Level

34 questions100 students

SPARFA-Mw/ 5 concepts

Visualize W, μ

Page 10: Sparse Factor Analysis for Learning Analytics

Tag AnalysisGoal: Improve concept interpretabilityLink tags to concepts

Page 11: Sparse Factor Analysis for Learning Analytics

Algebra Test (Mechanical Turk)

34 questions, 100 students

Concepts decomposed into relevant tags

Page 12: Sparse Factor Analysis for Learning Analytics

Synthetic ExperimentsGenerate synthetic Q/A data, recover latent factors

Performance Metrics:

Compare SPARFA-M, SPARFA-B, and non-negative variant of K-SVD

Page 13: Sparse Factor Analysis for Learning Analytics

Ex: Rice University Final Exam

Signal processing course

44 questions15 students100% observed data

SPARFA-M, K=5 concepts

Page 14: Sparse Factor Analysis for Learning Analytics

Student Profile

Average Student Profile on Rice Final Exam

Student 1 Profile on Rice Final Exam

SPARFA automatically decides which tags require remediation

Student Profile: Student’s understanding of each Tag

Page 15: Sparse Factor Analysis for Learning Analytics

STEMscopes8th grade Earth Science80 questions145 students

SPARFA-B: K=5 ConceptsHighly incomplete data: only 13.5% observed

Page 16: Sparse Factor Analysis for Learning Analytics

STEMscopes – Posterior Stats

Randomly selected students Single concept (Energy Generation)

Student 7 and 28 seem similar: S7: 15/20 correctS28: 16/20 correct

Very different posterior variance:

Student 7: Mix of easy/hard questionsStudent 28: Only easy questions – cannot determine ability

Page 17: Sparse Factor Analysis for Learning Analytics

Conclusions

• SPARFA model + algorithms fit structural model to student question/answer data

– Concept mastery profile– Relations of questions to concepts– Intrinsic difficulty of questions

SPARFA can be used to make automated feedback / learning decisions at large scale

Page 18: Sparse Factor Analysis for Learning Analytics

Go to www.sparfa.com

Dynamic Sparse Factor Analysis - Veronika Rock

From Sparse Regression to Sparse Multiple Correspondence ... · From Sparse Regression to Sparse Multiple Correspondence Analysis Gilbert Saporta CEDRIC, CNAM, Paris . [email protected]

Sparse signal representations using the tunable Q-factor wavelet …eeweb.poly.edu/~iselesni/pubs/Selesnick_2011_SPIE_TQWT.pdf · 2012-02-09 · Sparse signal representations using

Neural Factorization Machines for Sparse Predictive Analyticsstaff.ustc.edu.cn/~hexn/papers/sigir17-nfm-slides.pdf · Sparse Predictive Analytics • Many Web applications need to

Factors of Sparse Polynomials are Sparse

Deep Learning with Hierarchical Convolutional Factor Analysislcarin/BDL15.pdf · Deep Learning with Hierarchical Convolutional Factor Analysis ... of sparse auto-encoders [4], [5],

Analytics for Integrity - OECD · analytics is not a replacement for human judgement and professional scepticism. “Culture” is a critical factor of institutional readiness for

Sparse coding - GitHub Pagesyiiwood.github.io/images/Sparse Model for Data.pdf · 3/3/ Sparse representation – Sparse coding – Optimization for sparse coding – Dictionary learning

Sparse Multivariate Factor Regression - arXiv

Sparse Factor Analysis for Learning Analytics Andrew Waters, Andrew Lan, Christoph Studer, Richard Baraniuk Rice University

Sparse Coding in Sparse Winner networks

Sparse Matrix Sparse Vector Multiplication using Parallel ...web.eecs.utk.edu/~gdp/pdf/baugher-ms-thesis.pdf · Sparse Matrix Sparse Vector Multiplication using Parallel and Reconfigurable

Sparse Factor Analysis for Learning and Content Analytics

Sparse Matrices for High-Performance Graph Analytics · Sparse Matrices for High-Performance Graph Analytics John R. Gilbert ... Graph theory Computers The middleware challenge for

Discovering sparse transcription factor codes for cell states and … · 2017-03-16 · Discovering sparse patterns correlated with lineage transitions In order to identify gene expression

Maximum Likelihood Matrix Completion Under Sparse Factor ...€¦ · Background and Motivation Problem Statement Error Bounds Algorithmic Approach Experimental Results Acknowledgments

Bayesian Learning in Sparse Graphical Factor …jmlr.csail.mit.edu/papers/volume11/yoshida10a/yoshida10a.pdfrelevant sparse learning algorithms for posterior mode estimation. Linear,

MSCI Factor Analytics Brochure

1 Sparse Coding and Its Extensions for Visual Recognition Kai Yu Media Analytics Department NEC Labs America, Cupertino, CA

Context is the most important factor in web analytics

Trendrating Momentum Analytics: US Report · performance and financial success come from discipline and a systematic reality check of assumptions. Bias, ... Momentum factor analytics

Sparse Optimization - Lecture: Basic Sparse Optimization ...wotaoyin/summer2013/...Sparse Optimization Lecture: Basic Sparse Optimization Models Instructor: Wotao Yin July 2013 online

Tutorial on Sparse Coding - pami.sjtu.edu.cn... “Online dictionary learning for sparse coding,” in ... recognition via sparse ... et al. "Incremental sparse saliency detection."

Interpretable VAEs for nonlinear group factor analysis · choice in these settings is to consider sparse linear factor models (Zhao et al., 2016; Carvalho et al., 2008). However,

Error-bounded Sampling for Analytics on Big Sparse Data · Error-bounded Sampling for Analytics on Big Sparse Data Ying Yan Microsoft Research [email protected] Liang Jeff Chen

I FINANCIAL RISK F LOW-RANK/SPARSE …cdar.berkeley.edu/wp-content/uploads/2016/09/risk...Identifying Financial Risk Factors with a Low-Rank/Sparse Decomposition 2 Factor models in

Bathymetric Factor Graph SLAM with Sparse Point Cloud ...robots.engin.umich.edu/publications/vbichucher-2015a.pdf · Bathymetric Factor Graph SLAM with Sparse Point Cloud Alignment

Analytics & Data Warehousing Reader Surveycdn.ttgtmedia.com/rms/pdf/Analytics-Data-Warehousing-Reader Surv… · Analytics & Data Warehousing Reader Challenges & Priorities ... Factor

Neural Factorization Machines for Sparse Predictive Analyticsxiangnan/papers/sigir17-nfm.pdf · 2017-07-06 · Neural Factorization Machines for Sparse Predictive Analytics∗ Xiangnan

Nonparametric Bayesian Sparse Factor Models with ...mlg.eng.cam.ac.uk/pub/pdf/KnoGha11b.pdfNONPARAMETRIC BAYESIAN SPARSE FACTOR MODELS 3 using a straightforward Gibbs sampling algorithm

Topic analysis in news via sparse learning: a case study on the …elghaoui/pdffiles/IFAC... · 2018-07-31 · Keywords: Text analytics, news analysis, big data, sparse optimization

Sparse Factor Analysis for Learning and Content Analyticsstuder/papers/14JMLR-sparfa.pdf · 2. Statistical Model for Learning and Content Analytics Our approach to learning and content

A Latent Factor Analysis-Based Approach to Online Sparse

Sparse Matrices for High-Performance Graph Analyticsgilbert/talks/GilbertORNL3Oct2014.pdf · 1 Sparse Matrices for High-Performance Graph Analytics John R. Gilbert University of California,

Sparse Optimization - Lecture: Sparse Recovery Guaranteeswotaoyin/summer2013/slides/Lec03... · 2013-08-16 · Sparse Optimization Lecture: Sparse Recovery Guarantees Instructor:

sparse factor analysis for learning analytics

Documents

data sparfa

students concepts

students background

rice final exam sparfa

data data massive

concepts t1t2tmc1c2ck

easy questions

questionwhich questions