introduction to sas in spanish
TRANSCRIPT
Introduction to SAS
Introducción al lenguaje SAS por : Isabel Rodríguezhttps://www.linkedin.com/profile/view?
id=384254439&trk=hp-identity-name
Que es SAS?• SAS (Statistical Analysis System)(sistema de
análisis de estadistica)• Software suite fue desarrollado por SAS Instituto
para la analitica avanzada, inteligencia empresarial y gestion de datos predicción-
• Desarrollado en la universidad estatal Carolina de norte desde 1966 hasta 1976, Cuando SAS fue incorporada.
•Además desarróllo en la década de 1980 y 1990 los procedimientos y componentes estadísticos adicionales.
Componentes de SASActualmente, SAS tiene más de 200 componentes,
algunos de ellos son –• Base SAS –Procedimientos básicos y datos de
gestión• SAS/STAT – Análisis de estadística.• SAS/GRAPH – Gráficas y presentación.• SAS/OR – Investigación de operaciones• SAS/ETS – Econometría y Series de Tiempo
Análisis.• SAS/IML – Lenguaje matrix de interacción.
SAS en University Editionhttp://www.sas.com/en_in/software/university-edition/download-software.html
https://welcomedata.wordpress.com/2015/03/13/downloading-and-installing-sas-university-edition/
SAS Interface• Code Editor donde nosotros escribimos y modificamos el
modo.• Log es la grabación de cada cosa que nosotros hacemos en
una sesión de SAS o del programa SAS :– Declaración del programa identificados por línea de
números – Mensajes de comienzo puede ser nota, información,
advertencia ,error o número de error y procesos de tiempo
SAS Code Editor
SAS Log
SAS Result
SAS Explorer
• Todas las librerías , carpeta,archivos estan incluidos los data y guardan códigos los puedes encontrar aquí.
Lenguaje SAS • Programa SAS consiste en declaraciones SAS• Cada declaración SAS termina con punto y coma (;)• Básicas declaraciones de SAS son:
– Data Step– Proc Step
DATA Step – Usado para crear o modificar conjunto de datos.PROC Step (Procedimiento) - - Normas que analizan los datos del proceso pre-escrito en un conjunto de datos SAS y luego elaboran un informe.
Lenguaje SAS • Un Programa SAS puede consistir en un paso de datos o un
paso PROC o cualquier combinación de pasos de datos y Proc.• Data Step y Proc Step son seguidos por la declaración Run.• Data Step y Proc Step son seguidos por la Declaración Run• SAS declaraciones de formato libre.
–Ellos pueden comenzar y terminar al final de cualquier línea.
–Una declaración puede continuar en varias líneas tu usas To Comment (/*Comment*/).
Clase de asignación• Crear una hoja de códigos ,para que la ejecutes en la
clase.• Añadir comentarios cortos para cada programa o cada
nuevo paso.• Presentar la hoja de códigos al final de la clase.
Crear una Temporary Data set
i. Hay seis declaraciones de SAS .ii. DATA step – Crear un nuevo dataset llamado
primero.iii. PROC step – Imprimir/pantallas este dataset
en resultados /output ventana.
Pasos PROC • Proc PRINT• Proc DATASETS• Proc CONTENTS• Proc SORT• Proc FREQ• Proc MEANS• Proc UNIVARIATE• Proc CORR
Crear una Temporary Data set• Declaracion Input –
– Input nombres de variables, – Describe el arreglo de valores en el registro
de datos de entrada y sus asignaciones.• Datalines/Cards Statement indica ahí
debajo una existencia de líneas de datos.En el programa anterior:i. Hay 7 declaraciones de SAS ;ii. Declaraciones de INPUT define las variables va para ser leído en cada línea de datos.iii. Las declaraciones de DATALINES indica SAS estás DATA declaraciones son completadas y la proxima linea es step el contenido real del Data .iv.Observe que las líneas de datos no terminan en un punto y coma.
Crear Temporary Data set
Perdiendo valores para un caracter variable o?Vamos a chequear Log para errores
Crear Temporary Data setPara un carácter añadir la variable “$” Después el nombre de la
variable en el carácter en la declaración Input .
SAS Options
Aqui, PROC step prints solo la primera 4 observación del data set third
SAS Options
Aqui, PROC step prints el data set third empezando con la observación 2 hasta observación 4
SAS Libraries
Permanentes Libraries (Default) –• SASHELP – contiene conjuntos de
datos de muestra.• SASUSER – Almacena archivos
personales.Temporary Library – WORK – Almacena los archivos sólo
para la sesión actual
SAS FilesReglas para nombres -data set names –• i. 1 a 32 cáracteres• ii. Debe comenzar con un alfabeto AZ (mayúsculas o minúsculas)
o un guión• iii. Puede continuar con alguna combinación del alfabeto,
números y guiones bajos. Hacer referencia de SAS Files• Dos -niveles de nombre.• Referencia permanente de SAS data set en tu programa SAS ,
nosotros usamos dos-niveles de nombre , library name y el filename, o el nombre de data set :
• libref.filename
PROC Datasets
PROC DATASETS es usado • to list, copy, remove, or delete SAS files.• Cambiar información variable, como el nombre, formato,
Informat y la etiqueta.
PROC Datasets no requiere la declaracion RUN.
PROC Datasets
EL SAS log da el nombre de todo SAS datasets en la libreria llamada SASHELP
PROC Datasets – Declaracion CHANGE Siguiendo el programa , nosotros cambiamos el nombre del
dataset first to one usando la declaración CHANGE.
PROC Datasets – Declaracion DELETE
Siguiendo el programa, Nosotros usamos el dataset one con la declaración DELETE.
Crear data set con tu cuenta datasetrun• Uso la declaración SET y creó una temporary data set para
el uso actual de la sesión a partir de una existente data set• Imprima el nuevo conjunto de datos utilizando PROC PRINT
• Intenta y ver que el siguiente programa existente hará
PROC Print – TITLE Como su nombre indica, Declaraciones TITLE se añade mientras se imprime la salida.
PROC Print – SUM
Para generar los totales de columna utilizan Declaración SUMA dentro PROC Step
PROC SortAquí, PROC Sort se utiliza para crear un conjunto de datos
ordenados en orden ascendente de acuerdo con la variable team.
Calcular un Subtotal Aquí, Nosotros calculamos y imprimimos el subtotal para nhits
ordenado por la variable team.
PROC Contents
PROC Contents -• Proporciona información para SAS datasets o libraries • Se da el nombre del dataset or library,la ubicación, Cuando
este fue creado, el anfritrión que lo creó y el tiempo de la última modificación
• Para el datasets también proporciona el número de observaciones al data set y los atributos para cada variable
PROC ContentsSiguiendo los requerimientos de información para sashelp.baseball
dataset usando PROC Contents.
PROC Freq
PROC FREQ – •Cuenta el número (frecuencia) de ocurrencias de cada
variable (tanto carácter y numérico).• Proporciona estadísticas de los datos.• Produce unidireccional a la frecuencia n-forma y las tablas de
tabulación cruzada.• Produce impresos de salida por defecto.• Enumera cada valor de la variable junto con las frecuencias y
porcentajes.
PROC FreqSiguiendo el programa demuestra la simple forma de PROC FREQ y proceso de salida output
La salida de este programa es demasiado larga para nuestro propósito de incluir aquí.
Añadir Declaración MESAS para limitar la salida de una sola variable y crear una tabla de frecuencias en un solo sentido
PROC FreqCrear tablas bidireccionales de tabulación cruzada:En la declaración TABLE, los nombres de variables separadas por asterisco
PROC Means
PROC MEANS –•Produce las estadísticas de las variables numéricas.•Produce salida impresa por defecto•Calcula N, MEDIA, STD, MIN y MAX de una forma predeterminada
•Similar a PROC RESUMEN sin embargo, PROC RESUMEN no produce una salida de impresión por defecto.
PROC Means La siguiente muestra es el uso más simple del
procedimiento PROC MEANS.
PROC Means – VAR Declaración VAR – • Selecciona una variable específica. • Identifica las variables de análisis y su orden en la salida.
PROC Means – EstadisticaPara obtener una estadística específica se debe indicar la
declaración PROC MEANS .
PROC Means – Class • La declaración CLASS asigna una variable usada desde los
subgrupos. • La variable CLASS pueden ser numérica o de carácteres.
PROC Means – Output
Declaración Output dan lugar a nueva.data set. Aqui, la nueva data set es baseball_new.
PROC UnivariatePROC UNIVARIATE• Examina la distribucción de las variables numéricas.• Produce salida impresa por defecto.• Siguiendo la muestra del simple uso del procedimiento de
PROC Univariate.
PROC Univariate – NORMAL NORMAL Solicitudes de opciones para las pruebas de normalidad
que incluyen una serie de pruebas goodness-of-fit de ajuste sobre la base de la función de distribución empírica.
PROC Univariate – PLOT PLOT Option en PROC Univariate ,produce un
diagrama de tallo y hojas (o un gráfico de barras horizontales), un diagrama de caja y una parcela de distribución normal.
PROC Univariate – PLOT
DO Loops.
Incrementando un bucle Aquí el i se incrementa en 2 en el bucle.
Variable Dropping Aquí, nosotros creamos un dataset Sixth. Corremos una repetición usando una nueva variable i, pero colóquelo de modo
que no incluye en el conjunto de dataset.
Disminución del Loop
Aquí la i disminuye por 2 en un bucle
Dataset usando Raw file1. Crea una nueva carpeta en myfolders y
llámala mine.
2. Usa la declaración libname para crear una nueva SAS library mine.
Dataset usando Raw file
3. diamonds.csv dataset en la carpeta mine (SAS University Edition however can use datasets only till 10 mb. You can also use other data (SAS Universidad Edición embargo puede utilizar conjuntos de datos sólo hasta 10 mb. También puede utilizar otros datos desde: https://vincentarelbundock.github.io/Rdatasets/datasets.html)
4. Chequea la carpeta
PROC ImportNosotros usamos Proc IMPORT para importar el dataset. • OUT Option específica a un nombre para SAS data set• DATAFILE Es una declaracion especifíca de la locación /path de la
uploaded file. • DBMS Es una declaracion que indica el tipo de uploaded file. • GETNAMES Es una declaración que dice SAS en la primera fila de
los valores de datos se ha de considerar como nombres de variables o no (Sí - si para ser considerado como nombres de variables).
Dataset usando Raw file
Chequea la MINE Library
Crea un temporary data set llamada diamantes , usando el asistente data set.
PROC CorrLa correlación es uno de los primeros pasos para entender la relación entre las variables. Para calcular la correlación en el SAS, utilizamos PROC CORR.
Procedimiento Corr calcula la correlación de pares de variables numéricas. Este procedimiento también proporciona algunas estadísticas de resumen por defecto - media, desviación estándar, Suma, Mínimo y Máximo.
ASIGNACION
Hacer uso de los procedimientos aprendidos en la clase para calcular las estadísticas de los diamantes data set.
https://vincentarelbundock.github.io/Rdatasets/csv/Ecdat/Diamond.csv
DOCUMENTACION SAS = Hallelujah!http://support.sas.com/documentation/
PROC SQLhttp://www2.sas.com/proceedings/sugi27/p191-27.pdf
PROC SQL
LENGUAJE MACRO https://v8doc.sas.com/sashtml/macro/znemacro.htm
LENGUAJE MACRO
ODS
http://support.sas.com/rnd/base/ods/scratch/ods-tips.pdf
ODS
http://support.sas.com/rnd/base/ods/scratch/ods-tips.pdf
Data Visualization usando SAS
Data Visualization usando SAS
Data Visualization usando SAS
Data Visualization usando SASUsando tareasmire https://welcomedata.wordpress.com/2015/03/23/quick-pie-charts-in-sas-university-edition/
Usando SAS
proc reg data=sashelp.cars; model MPG_City = Cylinders Weight ;run;
Usando SAS
proc reg data=sashelp.cars; model MPG_City = Cylinders Weight ;run;
Modelando usando SAS
proc reg data=sashelp.cars; model MPG_City = Cylinders Weight ;run;
Usando SAS
proc reg data=sashelp.cars; model MPG_City = Cylinders Weight ;run;
Usando SAS
Try this
proc reg data=sashelp.iris; model SepalLength = SepalWidth PetalLength PetalWidth ;run;
NOW TRY THIS
proc reg data=sashelp.iris; model SepalLength = SepalWidth PetalLength PetalWidth /vif collin;run;
Usando SAS : Multicollinearity
http://support.sas.com/documentation/cdl/en/statug/63033/HTML/default/viewer.htm#statug_reg_sect038.htm
Usando SAS : PROC LOGISTIC
proc logistic data=sashelp.Bmt; class Group; model Status=Group; run;
Usando SAS : PROC LOGISTIC
proc logistic data=sashelp.Bmt;
class Group; model Status=Group; run;
Introduction to SAS