1 information science 2005 tefko saracevic, phd school of communication, información and library...

45
1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey USA http://www. scils . rutgers . edu/~tefko

Upload: eloy-sepeda

Post on 28-Jan-2016

225 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

1

Information Science 2005

Tefko Saracevic, PhDSchool of Communication, información and Library StudiesRutgers UniversityNew Brunswick, New Jersey USA

http://www.scils.rutgers.edu/~tefko

Page 2: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

2

Organización de la presentación

1. El paisaje – problemas, soluciones, lugar social

2. Estructura – áreas principales de investigación y práctica

3. Tecnología – Recuperación de la información – la mayor parte

4. Información – representación; bibliometría

5. Gente – usuarios, uso, búsqueda, contexto

6. Ruptura paradigmática – distanciamiento de las áreas de investigación

7. Bibliotecas digitales – ¿de quiénes son?

8. Conclusiones – grandes cuestiones para el futuro

Page 3: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

3

Parte 1. El gran paisaje

Problemas abordados

Un poco de historia: Vannevar Bush (1945):Definió el problema como “... La tarea

masiva de hacer más accesible el enorme repositorio del conocimiento.”

Un problema que sigue con nosotros y sigue creciendo.

Tabla de contenidos

Page 4: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

4

… solución

Bush sugirió una máquina: “Memex ... Asociación de ideas … que duplique los procesos mentales artificialmente.”

Una solución tecnológica al problemaTodavía con nosotros:

determinante tecnológico

Page 5: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

5

En la base de la Ciencia de la Información: un problema

Intentar controlar el contenido en: La explosión de la información

El crecimiento exponencial de los artefactos informativos, si no de la propia información

Y hoy ADEMÁS

La explosión de la comunicación El crecimiento exponencial de los medios y modos de

comunicación, transmisión, acceso y uso de la información

Page 6: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

6

solución tecnológica, PERO …

Aplicar la tecnología para solucionar los problemas en el uso efectivo de la información

PERO:Desde una perspectiva

HUMANA & SOCIAL Y no solo

TECNOLOGICA

Page 7: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

7

o un modelo simbólico

Información

Tecnología

Gente

Page 8: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

8

Problemas & soluciones: CONTEXTO SOCIAL

Práctica profesional E investigación científica relacionada con:Comunicación efectiva de los registros del

conocimiento - ‘literatura’ - entre humanos en el contexto de las necesidades y usos sociales, organizaciones e individuales

Con la ventaja de las nuevas tecnologías de la información

Page 9: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

9

Características generales

Interdisciplinariedad - relaciones con un conjunto de campos, algunos más o menos predominantes

Imperativo tecnológico - fuerza impulsora como en muchos campos modernos

Sociedad de la información - contexto social y papel social en su evolución - compartido con muchos otros campos

Tabla de contenidos

Page 10: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

10

Parte 2. Estructura

Composición del campo Como muchos campos, la ciencia de la

información tiene muchas áreas diferentes de concentración y especialización

Que cambian y evolucionan a lo largo de tiempose acercan y se separanse ignoran, más o menos, entre sí

Page 11: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

11

más importante aún, las diferentes áreas…

reciben más o menos financiación & énfasis produciendo grandes desequilibrios en el trabajo y el

progreso atrayendo diferentes audiencias y campos

esto incluye vastas diferencias en los niveles de soporte para la

investigación e inversiones y aplicaciones enormes en el campo comercial

Page 12: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

12

¿Cómo encontrar una estructura?descomponiendo áreas y esfuerzos en la

investigación y práctica, enfatizando

Tecnología

Información

oGente

o

Tabla de contenido

Page 13: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

13

Identificada con la recuperación de información (RI)con mucho se lleva los mayores esfuerzos e

inversioneses internacional y global los intereses comerciales subyacentes son grandes

y crecientes

Parte 3.

Tecnología

Page 14: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

14

Recuperación de información – definición & objetivo

“ RI: ... aspectos intelectuales de la descripción de información, ... búsqueda, ... & sistemas, máquinas...”

Calvin Mooers, 1951

¿Cómo proporcionar a los usuarios información relevante de forma efectiva?

Para ese fin:1. ¿Cómo organizar la información intelectualmente?2. ¿Cómo especificar la búsqueda & la interacción

intellectualmente?3. ¿Qué técnicas & sistemas usar efectivamente?

Page 15: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

15

Investigación contemporánea en RI

Ahora principalmente dentro de la Informática e.g Special Interest Group on RI, Association for Computing

Machinery (SIGIR,ACM)

Extendida globalmente v.g. grandes comunidades de investigación han emergido en

China, Corea y Singapur Sacada fuera de la Ciencia de la Información - “todo el

mundo hace recuperación de información” minería de datos, aprendizaje automático, procesamiento del

lenguaje natural, inteligencia articial, gráficos por ordenador …

Page 16: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

16

Text REtrieval Conference (TREC) Principal esfuerzo de investigación experimental Comenzó en 1992, ahora probablemente

terminando “para soportar la investigación de la comunidad RI

proporcionando la infraestructura necesaria para la evaluación en gran escala”

Métodos proporciona grandes bases de documentos, consultas, juicios de

relevancia y análisis comparativos usando esencialmente la metodología que uso Cranfield en los

sesenta organizada en varios temas que han ido evolucionando

Page 17: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

17

El impacto de TREC

Internacional – gran impacto en crear comunidades de investigación

Conferencias anuales informes, intercambio de resultados, cooperación

Resultados principalmente en informes, disponibles en

http://trec.nist.gov/pubs.html estados de la cuestión pero solo una parte publicada en revistas y libros

Page 18: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

18

Líneas TREC 2004103 grupos de 21 países

Genómica con 4 sub líneas HARD (High Accuracy Retrieval

from Documents) Novelty (nueva información no

redundante) Respuestas a consultas Robust (mejorando temas en los

que la recuperación es deficiente) Terabyte (colecciones muy

grandes) Web

Líneas anteriores: ad-hoc (1992-1999) routing (92–97) interactive (94-02) filtering (95-02) cross language (97-02) speech (97-00) Spanish (94-96) video (00-01) Chinese (96-97) query (98-00) y unas pocas más que solo

tuvieron dos años de duración

Page 19: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

19

Ampliación del RI – siempre cambiando y con nuevas áreas añadidas

RI a través de diferentes idiomas (CLIR) Procesamiento del lenguaje natural (NLP RI) RI de música (MIR) Imagen, vídeo y multimedia Lenguaje oral RI en Bioinformática y Genómica Resumen; extracción de texto Respuesta de consultas Interacción hombre/máquina XML RI RI en la Web; buscadores web RI en contexto – gran área para los grandes buscadores e

investigación más reciente

Page 20: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

20

RI comercial

Buscadores basados en la RI Pero añadiendo muchas elaboraciones e innovaciones

significativas gestionando enormes cantidades de páginas rápidamente interesantes juegos de algoritmos de spamming & page rank –

IR competitivo- combate de algoritmos incluyendo el contexto en la búsqueda

Extensión e impacto mundial unos 2000 buscadores en más de 160 países El inglés fue dominante, pero ya no

Page 21: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

21

RI comercial : “un mundo feliz” Grandes inversiones & sector económico

Esperanzas de grandes beneficios, aunque todavía cuestionables

Conduce a RI propietaria y secreta Con un fichaje agresivo de los mejores talentos Nuevos centros comerciales de investigación en diferentes

países (v.g. MS en China)

La financiación de la investigación académica está cambiando Fuga de cerebros de la academia

Los motores de búsqueda comerciales tienen que hacer frente a grandes retos Perspectiva de: Amit Singhal

Page 22: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

22

La RI puso en marcha con éxito

La emergencia y desarrollo de la INDUSTRIA de la información

La evolución de la CI como PROFESIÓN y CIENCIA Muchas APLICACIONES en muchos campos

Incluyendo la Web – motores de búsqueda Mejoras en la INTERACCIÓN PERSONAS -

COMPUTADORAS La evolución de la INTEDISCIPLINARIEDAD

La RI tiene una larga y orgullosa historia

Tabla de contenidos

Page 23: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

23

Parte 4.

Información Varias áreas de investigación

Como un fenómeno básico – no demasiado progreso• Medidas como las de Shannon no han tenido éxito• Concentrada en sus manifestaciones y efectos• No hay progreso reciente en este tema de investigación

básicaRepresentación de la información

• Gran área conectada con RI, biblioteconomía• Metadatos

Bibliometría• Estructuras de la literatura

Page 24: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

24

¿Qué es la información?Bien comprendida intuitivamente, pero mal formulada

formalmente Han emergido varios puntos de vista y modelos

Shannon: fuente - canal -destino señales no son contenido – no es realmente aplicable, a pesar

de muchos intentos

Cognitivo: cambios en las estructuras cognitivas Procesamiento y efectos del contenido

Social: contexto, situación Búsqueda de información, tareas

Page 25: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

25

La información en la Ciencia de la Información: Tres sentidos (del más estrecho al más amplio)

1. información en términos de la decisión, sin tener en cuenta prácticamente los procesos cognitivos

señales, bits, datos simples - v.g.. Teoría de la Información (Shanon), Economía,

2. información incluyendo el procesamiento cognitivo y la comprensión

comprensión, emparejamiento de textos, Brookes3. información también en relación al contexto, la

situación, el problema a resolverβ USUARIOS, USO, TAREA

Para la Ciencia de la Información (incluyendo la recuperación de información):

la tercera interpretación, la más amplia, es necesaria

Page 26: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

26

Parte 5.

Gente Servicios profesionales

en la organización – moviéndose hacia la gestión del conocimiento y la inteligencia competitiva

en la industria – vendedores, agregadores, Internet, Investigación

Usuarios & estudios de usuario Estudios de interacción Ampliando el campo a los estudios de búsqueda de la

información, contexto social, colaboración Estudios de relevancia Social informatics

Page 27: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

27

Uso y estudios de usuarios

El área más antiguacubre muchos temas, métodos y orientacionesmuchos estudios están relacionados con la RI

• v.g. búsqueda, multitarea, visualización, navegación

Introduciéndose en los estudios de usuarios de la webEstudios cuantitativos y cualitativosEmergencia de la webmetría

Page 28: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

28

Interacción

El modelo tradicional de la RI se concentra en el emparejamiento, pero no en el lado del usuario y la interacción

Diversos modelos de interacción han sido sugeridos

• Ingwersen’s cognitive, Belkin’s episode, Saracevic’s stratified model

Difícil de realizar experimentos y de confirmarlos Se consideran clave para proporcionar

• las bases de un diseño mejor • la comprensión sobre el uso de los sistemas

Las interacciones en la Web: una nueva área clave

Page 29: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

29

Búsqueda de información

Se concentra en el contexto más amplio, no solo en la RI o la interacción: en la gente según se comporta en la vida y el trabajo

Ha proporcionado varios modelos v.g. Las etapas de Kuhlthau’s stages, o el modelo basado en tareas

de Järvelin Incluye estudios sobre la vida real, construcción del sentido,

localización de la información, vida laboral, descubrimiento de información

Basado en el concepto de la construcción social de la información

Tabla de contenidos

Page 30: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

30

Parte 6. Ruptura del paradigma entre sistemas y gente

Desde principios de los años ochenta se ha producido una ruptura entre dos enfoques:

centrado en los sistemas algoritmos, TREC, motores de búsqueda continua el modelo tradicional de RI

centrado en los humanos (usuarios) cognitivo, situacional, estudios de usuarios modelos de interacción, algunos comenzados en TREC

Page 31: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

31

Lado humano vs. sistema

Lado humano (usuario) : a menudo crítico, incluso unilateral propone un mantra de implicaciones para el diseño pero no proporciona resultados en la práctica

Lado del sistema: ignora los estudios H ‘dinos que hacer y lo haremos’

El tema NO es H o S ni siquiera menos H vs. S sino como pueden H y S trabajar juntos uno de los principales retos para el futuro

Page 32: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

32

Llamadas vs soporte

Muchas llamadas a un diseño, enfoque y evaluación centrados en el usuario/humano

Conjunto de obras que lo discuten, pero pocas proponen soluciones concretas

Sin embargo, la mayor parte del soporte se va al trabajo de sistemas en la era digital el soporte es para lo digital

Un intento reciente de combinar ambas perspectivas:Book: Ingerwersen, P. and Järvelin, K. (2005). The turn:

Integration of información seeking and retrieval in context. Springer.

Tabla de contenidos

Page 33: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

33

Parte 7. Bibliotecas digitales

Área ENORME & creciente Área “caliente” in I&D

con un número importante de becas y proyectos en los EE. UU., Europa y otros países

pero en ellos lo “DIGITAL” es grande & “bibliotecas“ pequeño

Área “caliente” en la prácticaSe están construyendo colecciones digitales y

bibliotecas híbridasExisten muchos proyectos por todo el mundo

Page 34: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

34

Problemas técnicos

Sustanciales - mayores y más complejos que lo anticipado: representación, almacenamiento y recuperación de los

objetos bibliotecarios digitales• particularmente si fueron originalmente diseñados para ser

impresos y luego se digitalizaron gestionar operacionalmente grandes colecciones - temas

de escala tratar con colecciones diversas y distribuidas

• interoperabilidad asegurar la preservación y la persistencia incorporar la gestión de derechos

Page 35: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

35

EEUU: Digital Library Initiatives

Consorcios dependientes de la financiación de la National Science Foundation DLI 1: 1994-98, 3 agencias, $24M, 6 grandes proyectos DLI 2: 1999-2006, 8 agencias, $60+M, 77 proyectos grandes y

pequeños en varias categorías proyectos internacionales conjuntos National Science, Mathematics, Engineering, and Technology

Education Digital Library• cerca de 200 proyectos de demostración & desarrollo

La financiación terminada en 2005 ahora desviada a áreas relacionadas

Page 36: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

36

Unión europea: DELOS

DELOS Network of Excellence on Digital Librariesmuchos proyectos a lo largo de la Unión Europea

• de carácter muy tecnológicomuchas reuniones y talleres hasta cierto punto recuerda a las DLIs de los EE.

UU:bien financiados, a largo plazoa diferencia de lo que ocurre en los EE. UU. el

soporte continúa

Page 37: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

37

Temas de investigación comprender los objetos en las BD

representados en muchos formatos

metadatos, catalogación, indización conversión, digitalización organización de grandes colecciones gestión de colecciones, escalamiento preservacion, archivo interoperabilidad, estandarización acceso, uso, búsqueda

búsqueda federada en colecciones distribuidas

evaluación de bibliotecas digitales

Page 38: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

38

Proyectos de BD en la práctica Muy orientados a las instituciones y sus

misionesen bibliotecas, pero también en otras

• museos, sociedades, gobiernos, empresas• en muchas variantes

Extendidos globalmenteincluyendo la digitalización

U California, Berkeley’s Libweb “lista más de

7300 páginas de bibliotecas de más de 125 países” Extendiéndose a gran velocidad

a menudo a costa de otros recursos

Page 39: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

39

¿En conexión?

La investigación y la práctica actual en BD son desarrolladas actualmente mayormente de forma independiente

una de otra informando mínimamente a la otra

parte y con una conexión mútua ligera o

inexistente Son en el momento actual

universos paralelos con escasas conexiones e interación no es bueno ni para la investigación

ni para la práctica

Tabla de contenido

Page 40: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

40

Parte 8. Conclusiones

Las contribuciones de la CI

Puso en marcha la gestión de la información en la sociedad

Desarolló un cuerpo organizado de conocimiento y de competencias profesionales

Aplicó la interdisciplinariedad Alcanzó un estado de madurez

penetró muchos campos y actividades humanas Acentuó el factor HUMANO en la interacción

hombre-máquina

Page 41: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

41

Retos Ajustarse al papel organizacional y social creciente y

cambiante de la información y de la infraestructura informacional relacionada

Jugar un papel positivo en la globalización de la información

Responder al imperativo tecnológico en términos humanos

Responder a los cambios que se han producido desde la explosión de la información a la de la comunicación convirtiendo las propias experiencias en soluciones,

especialmente en el campo de la web Unir competitividad y calidad Reunir lo DIGITAL con las BIBLIOTECAS

Page 42: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

42

Momento crítico

La CI está en un momento crítico de su evolución Muchos grupos y campos… se están desplazando al campo

de la información fuerte competencia entrada de jugadores poderosos lucha por el control

Para ser un jugador de primera, la CI necesita progresar en: investigación & desarrollo competencias profesionales esfuerzos educacionales relaciones interdisciplinares

Es necesaria una re-examinación

Page 44: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

44

Page 45: 1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey

45

Bibliografía

Bates, M. J. (1999). Invisible Substrate of información Science. Journal of the American Society for información Science,50, 1043-1050.

Bush, V. (1945). As We May Think. Atlantic Monthly, 176, (11), 101-108. Available: http://www.theatlantic.com/unbound/flashbks/computer/bushf.htm

Hjørland, B. (2000). Library and información Science: Practice, Theory, and Philosophical Basis. información Processing & Management, 36 (3), 501-531.

Pettigrew, K.E. & McKechnie, L.E.F. (2000). The use of theory in información science research. Journal of the American Society for información Science and Technology, 52 (1), 62 - 73.

Saracevic, T. (1999). información Science. Journal of the American Society for información Science, 50 (9) 1051-1063. Available: http://www.scils.rutgers.edu/~tefko/JASIS1999.pdf

Saracevic, T. (2005). How were digital libraries evaluated? Presentation at the course and conference Libraries in the Digital Age (LIDA)30 May-3 June 2005, Dubrovnik, Croatia. Available: http://www.scils.rutgers.edu/~tefko/DL_evaluation_LIDA.pdf

Webber, S. (2003) información Science in 2003: A Critique. Journal of información Science, 29, (4), 311-330.

White, H. and Mc Cain, K. (1998). Visualizing a Discipline: An Author Co-citation Analysis of información Science 1972-1995. Journal of the American Society for información Science, 49 (4), 327-355.