Internet constituye uno de los fenómenos que más asombra al hombre
promedio hoy día. Su desarrollo en progresión geométrica,
como es lógico, impresiona y desconcierta a muchos. Y no es menos cierto,
que la industria de la computación y las telecomunicaciones experimentan
un avance tan acelerado que pocas disciplinas pudieran igualárseles, pero
también no es menos cierto, que fueron muchas las décadas en las
que el hombre puso todo su empeño por obtener y perfeccionar los primeros
componentes y dispositivos. Antes de los primeros logros, tuvieron que recorrer
un largo camino las matemáticas y la física; después concurrieron
la electrónica, la computación y muchas otras disciplinas.
Sin
embargo, no es precisamente el desarrollo acelerado de esta gran red la causa
del asombro principal, sino su poder de penetración en la vida humana,
su capacidad de revolucionar desde el puesto de trabajo hasta las relaciones sociales:
su capacidad de mediar en casi todos los actos de la vida moderna.
Por
otra parte, como es lógico en un fenómeno relativamente nuevo y
explosivo, existe una abundante, dispersa, e inmadura bibliografía sobre
el tema, por demás rápidamente desactualizable, que impide obtener
una visión completa de la evolución de uno de los fenómenos
más espectaculares del siglo XX.
Ello es muy necesario para
todos. Internet es una revolución que arrastra tras de sí a millones
de individuos, ante la cual es preciso, primero: comprender correctamente sus
antecedentes, origen, evolución, estado actual y tendencias; y segundo:
adoptar una posición reflexiva, que posibilite comprender el lugar del
individuo y el sentido que para él tiene esta nueva tecnología.
Ante estas demandas, y a la espera de la publicación de obras completas
sobre el tema, surgió la idea de elaborar una especie de cronología
de los principales momentos por los que ha transcurrido el desarrollo de esta
gran red, convertida en el gran nuevo espacio del progreso humano.
Fundamentalmente dirigida a estudiantes de las carreras de información, pretende, a partir de la síntesis de la bibliografía disponible, enriquecida con elementos conceptuales, facilitar la comprensión de los principales avances que ha experimentado esta red desde su nacimiento hasta el momento actual.
Aunque, la primera vez que se emplearon
las terminales (en aquel tiempo teletipos) para comunicar computadoras por medio
de líneas telefónicas fue en los años 40, no es hasta la
década de los 60, que se amplió considerablemente el acceso directo
a las computadoras e indirecto a las bases de datos mediante líneas telefónicas.
El lanzamiento al espacio del primer satélite soviético,
el Sputnik, en octubre de 1957 puede tomarse como un punto de referencia seguro
para el comienzo de la historia de Internet. La puesta en órbita terrestre
de aquella pequeña bola de metal galvanizó a los Estados Unidos.
La precisión que requería el envío al espacio de un cohete
y su transformación en un satélite artificial de la Tierra era superior
a la que exigía el lanzamiento de una bomba nuclear a un objetivo. Aquella
conmoción produjo diferentes resultados, que fueron desde los subsidios
para desarrollar formas efectivas de entrenamiento de los científicos hasta
la creación de una nueva agencia de defensa, la Advanced Research Project
Agency (ARPA - siglas en inglés).
En 1961, el sabotaje a tres
torres de microondas en Utah renovó, aunque a menor escala, la sensación
de pánico que produjo el Sputnik unos años antes. La preocupación
sobre la confiabilidad de los mecanismos militares de "comando y control",
así como el temor a nuevos ataques terroristas que pudieran dejar al país
sin medios de comunicación estimularon la búsqueda de infraestructuras
más resistentes. El último fin de aquella búsqueda fue el
diseño de un sistema de comunicación capaz de sobrevivir a una guerra
nuclear.
Es precisamente en el año 1962 que surge el proyecto
de Internet, producto del interés de los Estados Unidos por crear una red
de militar capaz de soportar las comunicaciones de esta esfera bajo las condiciones
de un ataque nuclear procedente de la entonces Unión Soviética y
otros países del campo socialista.
Entre 1962 y 1964, Paul
Baran de la Rand Corporation, elaboró una serie de informes en los
que sugirió la creación de una estructura de comunicación
en forma de tela de araña con el fin de impedir la selección de
objetivos para cualquier forma de ataque. Para este proyecto, se empleó
el protocolo de Internet. Probablemente era la única tecnología
capaz de sobrevivir a un ataque nuclear.
En 1962, ARPA creó
la Information Processing Techniques Office (IPTO - siglas en inglés).
La fundación de dicha institución posibilitó que la agencia
de defensa se vinculara con el naciente campo de la computación. Esta tuvo
una participación importante en el desarrollo del trabajo a tiempo compartido,
la computación interactiva y las redes. En efecto, si es posible que varias
personas se conecten simultáneamente a una misma computadora mediante diferentes
terminales no es difícil pensar en la existencia de una segunda computadora
que actúe como si fuera una terminal temporal de la primera y viceversa.
Desde una perspectiva económica, la creación de redes generaría una mayor explotación de los recursos con un costo menor.
El tiempo compartido permitió el uso más efectivo de las máquinas en relación al costo de su capacidad computacional.
Extender
una red cuanto sea posible sobre un territorio parece una idea aún mejor.
Los intereses económicos se encontraban en la base de la agenda de trabajo
de la IPTO.
En 1966, esta entidad financiaba 17 sitios que mostraban
un desconcertante rango de hardware y software. La incompatibilidad era la regla;
continuar por ese camino crearía gastos innecesarios. Estas condiciones
facilitaron la identificación de la red como una posible solución
al problema creciente de los costos.
Una red puede presentar diferentes
formas. Las redes se conciben generalmente como un sistema estelar con un núcleo
o como una telaraña. La última topología es mucho más
difícil de destruir y flexible aunque implica que los mensajes deben dirigirse
de forma dinámica para poder considerar las posibles variaciones de la
integridad de la red. Sus objetivos principales son comunicar fácilmente
resultados e información, compartir software, facilitar la comunicación
entre los individuos. El objetivo original de ARPANET era ofrecer acceso remoto
a computadoras distantes para compartir tanto ficheros remotos como las experiencias
de investigación en materia de computación.
A comienzo
de la segunda mitad de los 60, ARPA, del Departamento de Defensa realizó
un número considerable de investigaciones relacionadas con la confiabilidad
y las posibilidades de supervivencia de las redes de commutación de paquetes
para circuitos de telecomunicaciones redundantes con el objetivo de planificar
el desarrollo de una red experimental de commutación de paquetes durante
1967-1968. Para ello, se concedió un contrato a Bolt, Beranek y
Newman Inc. (BBN) en Cambridge, Massachusets.
En 1967, durante
la reunión de la Association for Computing Machinery (ACM) en Tennessee
se esbozaron muchas de las ideas a partir de las cuales se conformó el
núcleo de la primera red de ARPA. En ella, los oradores de Gran Bretaña,
R. Scantlebury y D.W. Davies, expusieron sus concepciones
sobre la conmutación de paquetes - un concepto nuevo en aquella época.
De acuerdo con Peter Salus, Davis utilizó el término
"paquete", por primera vez, en 1966.
En aquella reunión,
Davies definió la conmutación de paquetes como "un sistema
de almacenamiento y envío de mensajes cortos". De igual forma, se
introdujo la idea de utilizar computadoras que actuaran como intermediarias en
el enlace de las redes locales para obtener un nivel mayor de conexión,
un área más amplia y una red más rápida - idea que
se adoptaría en la primera etapa del desarrollo de ARPANET.
En noviembre de 1967, Larry Roberts formó el Network Working Group (NWG -siglas en inglés) cuyos integrantes se reunieron el mismo mes. Dicho grupo estaba compuesto por representantes de los sitios que tomarían parte en las primeras conexiones, como eran la University of California, Stanford, la University of Utah, la UCLA, así como de la Rand Corporation.
El
NWG trabajó durante el invierno que siguió a noviembre de 1967.
El 1 de marzo de 1968 se encontraban listas las especificaciones para la construcción
de la red.
En junio de 1968, Larry Roberts presentó
un proyecto que contenía el programa de construcción de la futura
red al director de ARPA. A este proyecto, se destinaron 2,2 millones de dólares.
La firma consultora BBN (Bolt, Beranek y Newman) localizada cerca
de Boston obtuvo el contrato para la realización del proyecto.
El
proyecto era preciso. La BBN debía diseñar un equipo que posibilitara
a varios hosts interconectarse mediante una red de computadores intermediarios
denominadas "Procesador de Mensajes de Interfaz (IMP- Interface Message Processor,
en inglés).
Paralelamente al trabajo en el IMP, se publicó
el famoso informe 1822 de la BBN, titulado "Procesador de Mensajes de Interfaz:
especificaciones para la interconexión de un host y un IMP (siglas en inglés)",
en mayo de 1969 que de acuerdo con Peter Salus era la Biblia de las redes.
Dicho informe se sometió a varias revisiones hasta 1978. En octubre de
1980, se le añadió un apéndice que describía la norma
X.25 del Comite Consultatif Internationale de Telegraphie et Telephonie (CCITT).
Durante el transcurso del año 1969, el diseño de los programas
acompañó el trabajo en el hardware. El primer modelo que apareció
fue el denominado cliente-servidor, un modelo familiar por la omnipresencia de
terminales que empleaban las computadoras a tiempo compartido.
Esto
condujo a la creación del Network Control Program (NCP), el primer programa
de control de redes que después se denominó Network Control Protocol.
La expresión "protocolo" se deriva de la tradición diplomática;
aparentemente surgió de una metáfora que se utilizó en una
conversación entre Vint Cerf, Jon Postel y Stephen Crocker
en fecha no determinada. En el RFC (Requests for Comments) número 33 de
Crocker y Cerf con fecha 12 de febrero de 1970, se empleó
el término en su título ("New Host-to-Host Protocol).
Los
protocolos de comunicación son conjuntos de reglas que permiten que diferentes
computadoras con distintos sistemas operativos se comuniquen y compartan recursos.
Los más importantes son: IP (Internet Protocol), TCP (Transmission Control
Protocol), FTP (File Transfer Protocol), TelNet (Network Terminal Protocol), y
SMTP (Simple Mail Transmission Protocol).
En septiembre de 1969, se
instaló el primer procesador de mensajes de interfaz, denominado ARPANET,
en la Universidad de California (UCLA), en Los Angeles. Contaba con cuatro nodos
enlazados mediante líneas telefónicas. La primera conexión
entre un host y un IMP se produjo el dos de septiembre de 1969 en la UCLA.
El 21 de noviembre de 1969, el grupo que trabajaba en la conexión
de Stanford, mostró un enlace estable entre esta universidad y la
UCLA con el auxilio de sus respectivos IMPs ante la presencia de los expertos
de ARPA. A finales de noviembre, la University of California, Santa Bárbara
(UCSB) obtuvo su IMP y la de Utah en diciembre de 1969. Antes de que concluyera
el año 1969, se habían instalado y se encontraban funcionando los
primeros cuatro nodos de ARPANET. A partir de entonces, ARPANET creció
de forma geométrica.
Como es de suponer, el programa de investigación
en commutación de paquetes de ARPANET requirió de una base económica
fuerte, porque las computadoras de finales de los 60 y principios de los 70, particularmente
las máquinas mas avanzadas resultaban costosas. En lugar de adquirir para
cada una de las instituciones que realizaban investigaciones para ARPA, era posible
instalar una o dos de estas máquinas a nivel nacional y compartirlas, por
ejemplo en el uso de software, que corrían solo en potentes máquinas,
bases de datos e información en general, mediante una red.
En
1970, L. G. Roberts y B. D. Wessler observaron que las bases de
datos podían almacenarse y mantenerse en puntos remotos en lugar de duplicar
los datos necesarios en cada sitio. De esta forma, no solo pueden accederse los
datos como si los usuarios fueran locales sino que un usuario desde cualquier
punto de la red puede, mediante un programa, recolectar datos de distintos sitios.
En abril de 1971, el ARPANET estaba compuesta por 15 nodos. En aquel momento,
ARPANET era una verdadera red de conmutación de paquetes. Sin embargo,
sus diseñadores percibían que los especialistas que laboraban en
el sector de las comunicaciones por medio de computadoras no habían tomado
conciencia de la significación de este hecho.
Bob Kahn,
quien se había trasladado a DARPA en 1972, decidió utilizar la International
Computer Communication Conference que se celebraría en Washington a finales
de octubre del mismo año para mostrar las posibilidades de la nueva tecnología.
La demostración fue un éxito. Kahn estima que este fue el
comienzo de un proceso que ha permitido convencer a la comunidad de investigadores
sobre las ventajas de conectar sus máquinas a la red.
La idea
de la red como un medio nunca se comprendió completamente en los inicios
de ARPANET. En 1972, S. D. Crocker y otros publicaron una de las primeras
descripciones acerca de un protocolo de aplicación relacionado con el trabajo
remoto y la transferencia de ficheros donde se subrayó el punto de vista
del usuario en lugar de la tecnología para la commutación de paquetes.
La mayoría de sus trabajos estaban dedicados al protocolo Telnet, para
el uso de sistemas interactivos remotos.
Hacia 1973, L. G. Roberts
estimó que ARPANET ahorró a la comunidad de investigadores norteamericanos
cuatro millones de dólares, al evitar la duplicación local de recursos
en el tiempo en que los costos de operación de la red eran de tres y medio
millones de dólares, incluida la amortización del hardware.
Se iniciaba entonces una década difícil. El período
que va desde 1972 hasta, al menos, 1983 y, de hecho, un poco más allá,
corresponde a la fase de mayor complejidad en la historia de Internet. A su vez,
es la parte menos documentada si se consideran los relatos e historias publicadas
hasta el momento. Dicho período se caracterizó por el conflicto
entre un gran número de individuos, instituciones, comunidades, sectores
y organizaciones.
Establecer una fecha exacta para el nacimiento de
Internet puede resultar algo complejo, porque ocurrió por partes. Sin embargo,
la publicación de un trabajo conjunto elaborado por Vinton Cerf y
Robert Kahn en 1974, luego de la demostración exitosa que se realizara
en Washington en 1972, puede tomarse como un punto de comienzo confiable. En este,
se sugirió utilizar una forma de protocolo conjunto TCP (Transmission Control
Protocol) y del IP (Internet Protocol).
La introducción del
TCP/IP posibilitó la interoperabilidad entre sistemas heterogéneos,
la comunicación entre terminales mediante una multitud de redes diversas
y el manejo automático de los fallos en la transmisión de datos.
Dicha combinación experimentó cambios sistemáticos
con vistas a su perfeccionamiento en los años siguientes. El trabajo de
Cerf Y Kahn contenía algunas de las ideas básicas de la comunicación
punta a punta y sobre la administración de los paquetes mediante protocolos
en lugar de nodos en circuitos. Como tal, abrió un camino para la exploración
y la experimentación en ARPANET.
Internet es un conjunto de
redes interconectadas que cubren la Tierra. Su crecimiento es superior al de todas
las otras redes electrónicas existentes.
Por otra parte, a inicios
de los años 70, los franceses y los ingleses comenzaron sus propios proyectos.
En Francia, el Cyclades y su subred el CIGALE, fueron el resultado
de estudios que comenzaron en 1970. El proyecto Cyclades experimentó con
rapidez recortes en su presupuesto un año después debido posiblemente
a que en 1974, el sistema de correo francés comenzó a trabajar en
una red propia de conmutación de paquetes que finalmente se convirtió
en Transpac, el servicio francés que se basado en el protocolo X.25.
En 1977, Gran Bretaña adoptó el protocolo X.25.
La
creación del X.25 proporcionó una alternativa a la utilización
del TCP/IP como una solución para la interconexión de redes. Mientras
que TCP/IP era un protocolo de uso probado, disponible libremente y sin propietario,
los portadores públicos deseaban un protocolo que estuviera diseñado
para satisfacer sus necesidades e intereses específicos que no eran necesariamente
los mismos que los de los usuarios académicos y militares, quienes apoyaban
los protocolos de ARPA.
El X.25 es una norma que desarrolló
CCITT, (una rama de la ITU - la International Telecommunications Union). La diferencias
entre el X.25 y el TCP/IP se resumen en dos puntos:
El X.25, se basa
claramente en el modelo telefónico. Descansa en la suposición de
que siempre existirá alguna forma de monopolio en este servicio público.
En contraste, el pensamiento que sustenta el TCP/IP surge a partir de la suposición
de que las redes proliferarán más o menos de forma anárquica.
"Si surge un orden de este caos, sólo puede soportarse
sobre cimientos anárquicos". El crecimiento de las redes locales demostró
rápidamente la validez del principio anterior. Por razones económicas,
las redes locales no emplean nodos de conmutación y el protocolo X.25,
dependientes como son del poder de cálculo de los nodos, no podrían
extenderse directamente a las redes locales.
Estos hechos constituyeron
un argumento importante a favor del TCP/IP. ARPA comenzó a adoptar gradualmente
el TCP después de 1974.
Ante la creciente discordia entre la
comunidad de especialistas en computación y el Postal, Telegraph and Telephone
(PTT) - un nombre europeo genérico que se utiliza para referirse a las
compañías telefónicas propiedad del estado. la International
Standard Organization comenzó a trabajar alrededor de un proyecto que denominado
OSI - Open System Interconection.
El esfuerzo de la ISO no se dirigió
a la creación de nuevos protocolos sino a la creación de un modelo
descriptivo, ordenado y abstracto que facilitara la racionalización del
diseño de las redes y comparar las soluciones. Dicho modelo, con sus siete
capas o niveles, se ha convertido en un patrón para los estudios de redes.
Sus capas son las siguientes: la física, de enlace, de red, de transporte,
de sesión, de presentación y de aplicación.
El
impacto del OSI sobre el desarrollo de las redes es difícil de valorar
porque los especialistas en redes relacionados con el TCP/IP confiaban en la fortaleza
una base bien establecida sobre implementaciones probadas.
El eventual
éxito de TCP/IP estuvo vinculado con otro factor que los europeos no pudieron
percibir. En 1969, se creó un nuevo sistema operativo para las computadoras
en los laboratorios Bell de la AT&T, denominado Unix. Este sistema se hizo
público en otoño de 1973, cuando Ken Thompson y Dennis
Ritchie expusieron un trabajo en el que presentaron sus características
esenciales. Su éxito fue rápido aunque hasta 1979, sólo lo
empleaba la PDP-11 de la DEC (13).
A principio de 1975, Unix se había
identificado como el sistema operativo de elección para las redes del estilo
ARPA. Como señalaron Peter Salus y otros, se pensó que se
colocaría al Unix en la red cuando en realidad se colocaba la red en Unix.
Este hecho constituyó otro elemento clave en el éxito para los protocolos
de Internet.
En 1976, la invención del UUCP o el Unix-to-Unix Copy por Mike Lesk, comenzó a solucionar los problemas relacionados con la transferencia de ficheros, el envío de correos y la ejecución de comandos remotos. El UUCP se utilizó para el envío de noticias entre la University of North Carolina y de Duke, idea que surgió de dos estudiantes, Tom Truscott y Jim Ellis. El UUCP creció rápidamente debido al uso que recibió en la diseminación ágil de noticias. Esto favoreció la popularidad de Unix.
En
la medida que Unix envolvía al TCP/IP, se beneficiaba Internet.
La
evolución de Internet en este período de tiempo no puede comprenderse
sin analizar cuidadosamente la forma en la que interactuaron e interfirieron movimientos
esenciales como el de Usenet con proyectos mayores concebidos dentro de grandes
instituciones. Ellos son un ejemplo típico de los resultados que pueden
generar la complejidad caótica y la autorganización.
La presentación
del Unix en 1979 para una variedad de máquinas y en particular para las
VAX, que compraban las universidades con frecuencia fue un factor importante.
Mientras que los europeos estaban interesados en los productos IBM, IBM no se
interesó en Unix. Ni Francia ni IBM fueron capaces de percibir el perfeccionamiento
que experimentaba Unix en manos del Berkerley's Computer Systems Research Group.
La versión mejorada de Unix incluyó el TCP cuyas especificaciones
DARPA les había entregado gratuitamente.
Su lanzamiento, en
septiembre de 1983, tuvo un gran éxito, hecho el cual puede apreciarse
en que más del 90% de los departamentos de ciencias de la computación
adquirieron dicha versión.
En 1979, los científicos de
la University of Wisconsin decidieron organizar una red diferente que se basara
en el UUCP para compensar la carencia de conexión con ARPANET. De esta
forma, nació CSNET.
En 1980, Vinton Cerf sugirió
enlazar CSNET y ARPANET por medio - una vez más - del TCP/IP por cuanto
el mismo se había diseñado precisamente para solucionar este tipo
de problemas. Otra vez, DARPA facilitó gratuitamente las especificaciones
del TCP/IP. Entre 1980 y 1983, se realizó el enlace de DARPANET con CSNET.
Dicho enlace puede considerarse como la materialización en la práctica
de las ideas expuestas en el trabajo de Cerf-Kahn en 1974.
En
enero de 1983, se decidió que todos los sitios de DARPA adoptaran el TCP/IP.
El éxito de esta transición sumamente delicada favoreció
al TCP/IP. El año 1983, se produjo un viraje importante en la historia
de Internet, sin embargo habría que superar muchos obstáculos difíciles
y los desafíos que impondría su desarrollo, para que Internet disfrutara
del éxito mundial del que goza actualmente.
El concepto de una
Internet con múltiples redes amplias que conectan incontables redes locales
se institucionalizó alrededor de 1983, cuando el protocolo que utiliza
hoy Internet, el TCP/IP, sustituyó al protocolo Network Control Program
(NCP). Este protocolo se diseñó no para soportar las comunicaciones
entre máquinas en una red sino entre redes que se interconectaran mediante
gateways (pasarelas, porterías)
En este mismo año, la
Agencia de Comunicaciones para la Defensa dividió ARPANET en dos redes:
MILNET para sustentar el tráfico de información de las operaciones
militares y ARPANET que continuaría soportando la comunidad académica
y científica. Ambas redes formaban el backbone nacional de Internet.
A inicio de los 80, en lugar de buscar computadoras host, costosas y grandes
conectadas con los procesadores de mensajes de interfaz, empezaron a instalarse
gateways que enlazaran los procesadores con redes locales completas de distintos
tamaños, que pudieran interactuar con computadoras ubicadas en otras redes
locales en cualquier lugar del país mediante el backbone o columna vertebral
de ARPANET.
Ahora bien, la capacidad de intercambiar mensajería
electrónica se identificó como una de las posibilidades más
beneficiosas de ARPANET, aunque es oportuno señalar que la mayoría
de las redes de computadoras se establecieron sin ninguna intención de
implementación de sistemas de correo electrónico.
El
problema en ARPANET era que, en la medida, en que crecía la complejidad
de la red, se hacía cada vez más necesario actualizar las tablas
con las direcciones de los host para conocer donde se encontraba cada uno de ellos.
Ante esta situación, en 1983, Jon Postel hizo público
el RFC 821 en el que se especificaba el famoso Simple Mail Transfer Protocol (SMTP).
Después de 1986, estas especificaciones se actualizaron particularmente
con el MIME, Multipurpose Internet Mail Extensions, el cual permite enviar mediante
el SMTP mensajes que en lenguas que emplean acentos como el español o el
francés, imágenes, sonidos u otro tipo de información que
pueda codificarse en ASCII puro.
En 1983, Paul Mockapetris publicó
los RFC 882 y 883 que sirvieron de base al Domain Name System. Tras una serie
de mejoras y extensiones que Craig Partridge resumió en su RFC 974 de -
Mail Routing and the Domain System -, surgió un sistema que facilitó
significativamente la localización y el envío de correos dentro
de la red. Como afirma Peter Salus, estos avances comenzaron a transformar
a Internet en un servicio como lo son la electricidad y el teléfono.
Hacia 1985, la National Science Foundation (NSF) financió cinco
enormes centros para que sirvieran como recursos nacionales de supercomputación.
Estos sitios se enlazaron con ARPAInternet, pero, a mediados de 1988,
la NSF había instalado una nueva red amplia llamada NSFNet para servir
al sector académico que utiliza el protocolo de comunicaciones de Internet
- el TCP/IP- y que como resultado de su alta velocidad de transmisión (1.54MBits
por segundo contra los 56 KBits por segundo de ARPANET) desplazó a la vieja
espina dorsal de Internet.
En el ámbito de los recursos de información,
hacía la década de los 70, las redes privadas de comunicación
de los Estados Unidos ofertaban un gran número de ellos con carácter
comercial. Sin embargo, su falta de integración y altos costos limitaron
su uso por parte de la comunidad académica.
Aun cuando los
antecedentes del acceso a los recursos de información mediante las telecomunicaciones
pueden ubicarse en los trabajos que desarrollaron P. Otlet y W. Schuermeyer
en los años 30, en la práctica las tecnologías empleadas
para ello constituían "la antítesis del acceso en red a los
recursos de información", al conformar estaciones únicas de
trabajo, aisladas e independientes.
Durante las décadas de los
70 y los 80, hubo un crecimiento asombroso de los recursos de información
que soportaban todos los campos de la investigación y la docencia como
resultado del perfeccionamiento de los sistemas de gestión de bases de
datos, de la adquisición de la experiencia necesaria para estructurar,
crear y manejar los recursos de información, así como del aumento
del valor con que se percibían dichos recursos. En la década de
los 80, con la aparición de nuevos soportes de almacenamiento, ocurrió
un cambio de concepción: las bases de datos se colocaron en manos del usuario,
por aquel entonces, instituciones medianas y pequeñas, aún. La información
cambió también de estructurada a relacionada.
Sin embargo,
el proceso de utilización de un sinnúmero de bases de datos de forma
integral se hizo cada vez más difícil debido a la necesidad de dominar
múltiples interfaz de búsqueda y de los problemas para combinar
los resultados almacenados en diferentes sistemas de tiempo compartido (en diferentes
redes) y en estaciones de trabajo aisladas, con sistemas de recuperación
basados en CD-ROM, en un solo resultado, en la medida en que el número
de recursos se multiplicaba.
Al parecer, cada cierto tiempo, se produce una
crisis cíclica, debido al crecimiento geométrico de los recursos
de información: libros, revistas, índices, bases de datos, etcétera,
que obliga a la creación de nuevos tipos de recursos, cada vez más
abarcadores.
Tal estado de cosas estimuló el surgimiento de
una nueva visión en la que se concebía el acceso a la información
para soportar la investigación y la docencia en forma universal, simple
e integral.
Esta visión, reconocida generalmente como propia
de los miembros de la comunidad de la educación superior, no la compartieron
los especialistas en redes de computación, salvo raras excepciones, hasta
recientemente. Históricamente ha existido una laguna considerable entre
aquellos que planificaban, financiaban y construían redes de computación
y aquellos que se preocupaban por el acceso a los recursos de información.
Ciertamente, los miembros de la comunidad de redes desde los primeros
días destacaron los beneficios de la conectividad a numerosos recursos
de información, pero trataron poco los problemas relacionados con su uso
efectivo.
Muchos bibliotecarios concibieron el uso de las redes y
el compartir recursos más en las operaciones bibliotecarias (catalogación,
préstamo interbibliotecario, etc.) que sobre aquellas que posibilitaran
un acceso público a los recursos de información a escala nacional.
Los esfuerzos para crear lo que son, en efecto, las bases de la información
bibliográfica nacional distribuidas masivamente excluyeron en gran medida
el acceso directo de los usuarios de la biblioteca hasta recientemente.
Los
trabajos sobre los protocolos de recuperación de información, por
su parte, comenzaron a mediados de los años 70.
Estos tienen
sus raíces en los esfuerzos de la Biblioteca del Congreso de los Estados
Unidos, con el apoyo del Council on Library Resources. A comienzos de los 80,
se iniciaron los esfuerzos para crear una base de datos distribuida en la nación
que soportara el procesamiento bibliotecario y compartir recursos, los que con
la ayuda de otras organizaciones. Así, se desarrolló el protocolo
de aplicación Z39.50, con el objetivo de facilitar la búsqueda en
bases de datos bibliográficas ubicadas en diferentes sitios, manipular
el proceso de la búsqueda y transferir los registros de un lugar a otro.
Dicho sistema se normalizó definitivamente en 1988.
Este protocolo
se consideró como una tecnología básica para el acceso a
los recursos de información de la nación norteamericana. Permitía
la realización de búsquedas con operadores booleanos. Aun cuando
su uso ha resultado común en el campo de las bibliotecas, como su desarrollo
ocurrió al margen del crecimiento de Internet, este no se construyó
sobre la base del desarrollo de la red nacional y se perdió la oportunidad
de tener acceso a uno de los principales recursos surgidos en los primeros momentos.
En 1989, miembros de la Corporation for National Resarch Initiatives concibieron
un sistema bibliotecario totalmente distribuido en el cual existieran programas
activos para la búsqueda de información que interactuaran con los
servers para recolectar, entregar y mantener recursos de información en
interés de los usuarios o de los servers.
Entre finales de
los años 80 y principios de los 90, ocurrió una explosión
de nuevas aplicaciones que transformaron completamente la visión de Internet.
En 1989, tuvo lugar un suceso imperceptible en el CERN(Conseil Européen
pour la Recherche Nucléaire) (Organización Europea para la Investigación
Nuclear) , un centro europeo de investigación en la rama de la física
situado cerca de la frontera franco - suiza. Tim Berners-Lee y Robert
Cailiaux comenzaron a concebir un sistema distribuido de documentos que se
estructuraría en forma de hipertexto. En aquel entonces, la idea tuvo solo
un alcance local.
Más espectacular fue la invención
de Archie en la Universidad McGill de Montreal. Peter Deutsch y Michael
Emtage descubrieron una forma de crear una base de datos que registrara los
sitios anónimos FTP ubicados en la red y una forma de actualizarla mensualmente.
Archie no sólo permitió el hallazgo de documentos que sin la existencia
de una autoridad central - algo claramente imposible dentro de Internet - sino
que mostró que Internet se había convertido en una gran biblioteca
distribuida. La experiencia de Archie no se perdió. Poco tiempo después,
apareció Gopher una nueva aplicación que ofrecía una extensión
del protocolo FTP.
Los finales de la década de los 80 marcaron
el punto de giro. Las diferencias filosóficas existentes en la concepción
y en los objetivos de desarrollo de las redes entre los especialistas en computación
y la comunidad académica, científica y bibliotecaria preocupada
mas con el uso de los recursos de información comenzaron a eliminarse.
En la medida en que se desarrollaron redes nacionales de computadoras,
cada vez mas amplias, robustas y capaces de servir a comunidades mayores, sus
diseñadores se percataron de que si las redes eran, en realidad, un sistema
de carreteras, en algún sentido, ellas debían existir mayormente
para permitir que sus usuarios alcanzaran destinos de interés y valor propio.
Se produce, en este momento, un cambio de concepción de la red como un
fin a la red como un medio.
Ya no resultaba suficiente pensar simplemente
en la red como un medio para mover información digital de un lugar a otro
como un fin en si mismo. Los defensores de las ideas sobre el acceso universal
a recursos de información, que habían soñado largamente con
lo que se podría lograr si estuviera disponible una conectividad de alta
velocidad, costeable y de amplio alcance - largamente frustrada por la aparente
imposibilidad de obtener y poder pagar por tal conectividad-, comenzaron a percatarse
que se estaban logrando dichas redes de comunicación y, mas aun, que "el
apoyo a" y "la explotación de" podrían acelerar su
crecimiento.
A finales de los años 80, cierto número
de catálogos en línea extendieron su cubrimiento más allá
de las colecciones monográficas mediante el montaje de bases de datos de
artículos de revistas.
Hacia 1989, existían 15 ó
20 catálogos en línea en Internet, el primero y mejor conocidos
de todos fue el Melvyl de la Universidad de California, que estuvo ampliamente
disponible a la comunidad de Internet.
Entre 1995 y 1996, la OCLC
(Online Computer Library Center), realizó un nuevo aporte en esta línea.
Su objetivo fue definir un formato amigable para la catalogación distribuida
de los recursos en la red, más rico que un índice creado automáticamente
y menos complejo que el tradicional registro bibliográfico, y así
estimular la cooperación para promover la interoperatividad semántica
a través de lenguajes y disciplinas, con el fin de lograr un efectivo control
del vocabulario de indización. La pregunta sería si no era demasiado
tarde para ello.
Durante los primeros años de la década
de 1980, algunas de las universidades principales habían desarrollado catálogos
de acceso público en línea para ofrecer a sus usuarios sistemas
de recuperación automatizados para la búsqueda en sus fondos.
Entre finales de los 80 y comienzos de los 90, el número de recursos
en Internet creció, hecho el cual generó diversos problemas. Se
dificultó a los usuarios la identificación y la localización
de recursos potencialmente relevantes para satisfacer las necesidades de información
en áreas específicas, particularmente si el usuario no era un especialista.
Cada recurso poseía un sistema de recuperación propio e independiente;
mientras que la disponibilidad de recursos sobre Internet permitía al usuario
alcanzar los recursos de manera fácil y económica (al menos en términos
de costos de telecomunicaciones) esto no eliminaba la necesidad de aprender a
manipular una interfaz nueva y única para poder utilizar cada recurso.
No existía, a su vez, una forma simple de mover los resultados de un sistema
a otro para su consolidación, análisis y almacenamiento porque el
acceso a cada sistema se realizaba mediante acceso remoto.
Con vistas
a solucionar al menos parcialmente el primer problema se desarrolló un
directorio general de recursos en Internet publicado, bajo los auspicios de la
NSF, por la BBN Network Information Center en 1989. Este directorio se convirtió
en una base de datos de recursos que incluía indizaciones profundas y complejas
y facilidades para la búsqueda.
Existió, a su vez, una
gran presión por parte de las facultades y de los estudiantes para que
las instituciones pusieran en servicio bases de datos comerciales en la red -
como sucedió con Medline, la principal base de datos sobre medicina que
produce la Biblioteca Nacional de Medicina de los Estados Unidos - de forma tal
que permitiera que estos recursos vitales estuvieran disponibles rápida
y masivamente. Sin embargo, dichas instituciones enfrentaron costos significativos
para la adquisición de los recursos de computación, el desarrollo,
el soporte necesario para crear y operar los recursos de información para
el servicio a los usuarios, así como el costo de las licencias para operar
las bases de datos de distintos propietarios. Uno de los beneficios técnicos
de montar localmente dichos recursos incluía la facilidad de integrar estos
con los ficheros de los catálogos institucionales.
Los intentos
para resolver el segundo y tercer problemas se dividen en dos categorías
principales: los que tratan de orientar el servicio con los recursos existentes
a las terminales remotas mediante el desarrollo de softwares para los usuarios
finales y los que emplean protocolos de red para convertir los recursos de información
en servers de información basados en red y ofrecer al usuario acceso a
estos nuevos servers de información mediante software clientes e interfaz
de protocolo.
Entre los primeros existe un gran número de sistemas
desarrollados para facilitar el uso de los recursos existentes. Sistemas como
Gratefull Med y Procite ofrecen interfaz más amistosas - más poderosas
y sencillas- con el usuario o que facilitan el mantenimiento de bases de datos
personales a partir de los registros que se extraen de sistemas remotos.
Los sistemas mas sofisticados intentaron, mediante la traducción
de las solicitudes al lenguaje particular de los distintos sistemas, que el usuario
final utilizara solo una interfaz, común para un grupo de recursos diferentes.
Esta vertiente enfrentó la limitación de que los sistemas remotos
cambian a menudo sus diálogos con las terminales, los software de este
tipo deberían entonces alterarse constantemente para reconocer tales cambios.
Estos sistemas no se prestan para la formulación interactiva de búsquedas
donde el usuario este inseguro de la terminología de la indización
y el tamaño de los resultados que pueden esperarse. Estos tienen un objetivo
limitado, permitir al usuario final buscar en un recurso de información
remoto en lugar de proveer una interfaz normalizada a los recursos de información.
La mayoría de los trabajos realizados con bases de datos no pueden
aplicarse directamente a la solución del problema del acceso en red a los
recursos de información. Un sistema cliente tendría que conocer
mucho sobre la estructura de la base de información o colección
de información que, en cierto sentido se organiza, articula y accede de
acuerdo con la semántica de la información, montada en cada servidor.
La base de información de un catálogo en línea es un conjunto
complejo de bases de datos (de autores, de materias, de registros bibliográficos,
de información sobre los fondos, etc.) en el que cuando se realiza una
búsqueda sobre los libros de un autor determinado, es probable que ocurra
una serie de búsquedas interrelacionadas y complejas en diferentes bases
de datos.
Aun cuando los años 80 fueron testigos del surgimiento
de nuevas redes, estos se caracterizan por el crecimiento estable del TCP/IP y
el surgimiento gradual de aplicaciones, es en los años 90 donde se produjeron
adelantos que transformaron totalmente la historia de Internet.
En los Estados Unidos, el crecimiento de la red nacional de computadoras se produjo, a partir primero de las contribuciones de la Agencia para los Proyectos Avanzados de la Defensa (Defense Advanced Research Projects Agency) y más tarde de las de la Fundación Nacional para la Ciencia (National Science Foundation), la Agencia Nacional para el Espacio Aéreo (National Aerospace Agency) y el Departamento de Energía.
En mayo de 1990, se celebró la primera conferencia sobre ciberespacio
en la Universidad de Texas en Austin.
A principios de los 90, el tema
del acceso a los recursos de información evolucionó de una idea
a un aspecto central en el desarrollo de las redes nacionales de computadoras
en la comunidad de académica y científica de los Estados Unidos.
Los recursos de información crecen rápidamente, así como
la base tecnológica para su integración.
La primera preocupación
fue, como es lógico, crear una infraestructura tecnológica adecuada
que permitiera soportar los recursos, así como la transferencia de información,
después, sobre todo, con el crecimiento acelerado de los recursos, el centro
de la atención se trasladó al acceso.
En 1990 surgieron
algunas corporaciones comerciales con proyectos para participar en Internet. Ello,
se aceleró hacia 1993. En estos años, existió también
una gran demanda por la sustitución de los intermediarios tradicionales
de información por software mediadores y bases de datos inteligentes para
el usuario final.
El desarrollo de los sistemas tecnológicos,
la facilidad de operación de los equipos y programas modernos, así
como la disminución de sus costos ha hecho pensar a muchos que las funciones
de los intermediarios desaparecerán.
Sin embargo, la realidad
muestra otro panorama bien distinto. Por ejemplo, una búsqueda en Internet,
el símbolo del progreso en materia de información, exige actualmente
del auxilio de un intermediario capaz de identificar, evaluar, seleccionar y adquirir
fuentes de información útiles, válidas y significativas,
tarea la cual resulta, en grado sumo difícil, si se considera la multiplicidad
de recursos cualitativamente diferentes disponibles, la carencia de precisión
de los instrumentos de búsqueda, el volumen de tiempo necesario para realizar
esta si se pretenden obtener resultados exhaustivos y precisos, entre otras limitaciones.
Y es que en la década de los 60 y los 70, se produjeron un gran
número de cambios. El trabajo del profesional de la información
comenzó a verse como parte integrante de la gran cadena de la comunicación
social, donde interactúa de forma creciente con otros eslabones de la cadena.
Esta concepción presenta actualmente una vigencia renovada.
En 1991,
se aprobó la Ley Pública 102-194 que establecía el US High
Performance Computing and Communication Program (HPCC).
En este año,
Internet poseía un enorme potencial para el suministro de recursos de información
a los profesionales del mundo; sin embargo, en aquel entonces, su acceso era posible
solo mediante los protocolos de transferencia de ficheros, las listas de correo
electrónico o de distribución, útiles para la discusión
y la transferencia de ficheros entre direcciones conocidas, pero poco apropiadas
para la búsqueda de nuevos recursos en la red para lo que resultaba necesario
transferir los ficheros hasta la máquina del usuario y leer sus introducciones
o guías locales de recursos disponibles.
No existía,
por lo tanto, un sistema para el manejo de los recursos de información
que facilitara su uso a escala internacional.
En 1991, Linder y Cahil
de la University of Minnesota desarrollaron un sistema, Gopher, que permitía
crear una estructura en forma de árbol que se manipulaba desde un menú.
En él, los documentos, que estaban distribuidos en Internet, parecían
provenir de un mismo sitio. A partir de una serie de menús jerárquicos,
el usuario selecciona las entradas que desea. Un menú de Gopher es una
lista de enlaces.
El cliente Gopher se presenta al usuario con una
estructura de ficheros similar a la del DOS que resulta familiar para muchos.
Dicha estructura contiene documentos, directorios (de distintas máquinas)
y entradas para localizar información. Los documentos pueden ser ficheros
texto, imágenes, servicios como Telnet. Gopher englobaba a otros protocolos
como Telnet o FTP, así liberaba al usuario del aprendizaje de las aplicaciones
propias de estos protocolos. Su principal inconveniente radicaba en su extrema
rigidez, determinada por la estructura jerárquica en la que se basa.
A pesar de ello, Gopher, fue el programa más popular de dominio
público para el almacenamiento y recuperación de la información
accesible en Internet, que producían y mantenían los distintos departamentos
de la universidad.
Con este sistema, cada departamento podía
crear y mantener servers Gophers en sus computadoras. Toda la información
se presenta en forma de directorios. El archivo Gopher se presenta como una lista
de directorios que contienen ficheros u otros directorios. Los directorios, a
menudo, señalan otros sitios Gopher. Uno puede moverse a través
de estos directorios y de Internet seleccionando directorios y redireccionando
las selecciones.
Cualquier directorio visto puede marcarse, el programa
almacena su ruta de acceso y posibilita el acceso directo posterior mediante el
uso automático del FTP, los ficheros pueden verse dentro de esta aplicación
y salvarse. Gopher ofrece también índices. Estos pueden ser directorios
y listas de correo, o más a menudo, índices de documentos de texto
completo que soportan búsquedas con operadores lógicos y el truncado.
De esta forma, la mayoría de los directorios y ficheros en
el sistema mundial Gopher pueden buscarse mediante un índice único,
Verónica, el equivalente Goher a Archie. El software del server Gopher
ha mostrado su utilidad tanto para pequeños laboratorios que diseminan
información sobre temas específicos como para aquellos que tienen
grandes recursos de información y desean integrar la información
de una universidad o de la nación. Los grupos pequeños tienden a
crear estructuras y directorios que se relaciona estrechamente con sus propias
operaciones mientras que los de grandes recursos toman la formidable tarea de
dar acceso a múltiples recursos de información y mantener la actualidad
y la relevancia de estos recursos.
Los numerosos puntos de acceso y
facilidades Gopher Archie son una puerta en forma de directorios, a partir de
la cual se obtienen distintos programas para el descubrimiento de recursos.
Pero los Gopher se multiplicaron y plantearon serios incovenientes para
el acceso.
Así surgió WAIS (Servidores de Información
de Área Amplia) un sistema de recuperación de información
distribuida que ayuda a los usuarios a buscar en distintas bases de datos de la
red mediante una interfaz sencilla. Conecta documentos o bases de datos. Las bases
de datos, denominadas fuentes, son fundamentalmente colecciones de documentos
textuales pero pueden incluir también imágenes y sonidos. Dichas
bases de datos se ajustan comúnmente a la norma Z39.50, que describe la
forma en la que una computadora solicita una búsqueda a otra ubicada en
la red.
Los documentos pueden abrirse y salvarse directamente y las
solicitudes almacenadas pueden correrse periódicamente como perfiles. Utiliza
el lenguaje natural para localizar documentos relevantes sobre el tema en el que
se realiza la búsqueda y genera como resultado una lista de referencias
procedentes de todas las bases de datos, ponderadas según el número
de veces que aparece la palabra y su posición en el texto. El resultado
de la búsqueda es una relación de referencias cuya relevancia se
pondera entre uno y 1000. Los documentos de mayor relevancia recibirán
una puntuación de 1000. Realiza búsquedas a texto completo.
En WAIS, en lugar de navegar a través de una serie de menús,
una vez que el usuario se conecta a un servidor de este tipo, recibe una lista
de términos que representan las temáticas sobre las cuales puede
realizar su búsqueda.
WAIS ofrece una interfaz única
para la búsqueda y visualización de los resultados de una variedad
de bases de datos comerciales y gratuitas geográficamente distribuidas.
El cliente WAIS permite al usuario construir prescripciones de búsqueda
en un lenguaje natural y correrlas en un conjunto de recursos seleccionados simultáneamente.
Su concepción, por tanto, es diferente a la de Gopher.
Sin embargo,
las bases de datos fuentes de WAIS crecieron y se hicieron muy numerosas.
El Gopher, un sistema textual, y WAIS fueron desplazados entonces por el
WWW. El WWW fue el invento más revolucionario después de la computadora
personal. El WWW es un sistema hipermedia que integra en una interfase común
a todos los recursos existentes en la red para su acceso en forma organizada y
normalizada, cubre todos los recursos del mundo en forma hipermedia o hipertexto.
Un hipertexto es un sistema que permite la realización de conexiones
lógicas entre las distintas partes de un documento o entre documentos diferentes.
De hecho, funciona de forma similar a como lo hacen las referencias cruzadas:
"ver..." y "ver también..." en un tesauro, con la ventaja
de que en el web los documentos pueden accederse mediante un simple "click"
en el mouse. En el web, se utiliza el hipertexto para navegar entre documentos
relacionados mediante enlaces que establecen sus autores y editores. Los browsers
sólo pueden identificar los enlaces y moverse entre ellos. A pesar de las
facilidades que ofrece, la navegación hipertextual presenta el riesgo de
"perder" al usuario en una sucesión de conexiones que pueden
apartarlo significativamente de su fin inicial.
Hipertexto es la denominación
general que se aplica a aquellos documentos o conjuntos de documentos electrónicos
en los que es posible navegar entre las diferentes partes del texto o entre documentos
a partir de las relaciones semánticas que entre ellos se establecen. Navegar,
en este contexto, es una noción que indica que la consulta de uno o varios
documentos puede realizarse "a saltos", es decir, sin seguir el texto
en forma lineal, secuencial o jerárquica como es tradicional en la lectura
de los textos impresos; sino en forma lógica mediante los enlaces que existen
entre sus distintas partes o entre diferentes documentos. Por ejemplo, usted puede
encontrarse leyendo un trabajo en el que se menciona un concepto determinado y
que usted desconoce, dicho concepto aparece destacado de alguna forma - con un
tipo diferente de letra, subrayado, etc.-, pues bien, con tan solo oprimir el
ratón sobre ese concepto marcado, usted puede obtener su definición
dentro del mismo documento o recuperar otros recursos que tratan sobre el tema.
Hipermedia, por su parte, es una extensión del hipertexto, una generalización
de este concepto. Mientras que en el hipertexto es posible solo moverse de un
texto a otro, en hipermedia, el movimiento puede realizarse entre piezas de información
o recursos de cualquier clase, sea texto, imagen, vídeo, sonido, base de
datos o programas.
Un hipermedio es un documento que se basa en los
mismos principios que un hipertexto. Su diferencia consiste en que el hipermedio
puede contener, además de textos, imágenes - animadas o no- y sonidos.
Por ejemplo, en un documento en el que se escriba sobre China, usted, con tan
solo marcar este concepto, puede obtener un mapa sobre este país y tal
vez hasta escuchar su himno nacional o canciones más populares, si así
su creador lo preparó.
El declive de Gopher, en especial, contribuyó
a llamar la atención de algunos usuarios sobre la interesante innovación
del CERN que durante años había permanecido en el anonimato. Para
aquel entonces, había tomado su nombre actual, WWW (W3). El WWW, desarrollado
por el CERN, el principal laboratorio de investigación en física
de las partículas, presentaba un diseño original. Es un sistema
de información basado en hipertexto que permite navegar a través
de los documentos situados en Internet. Los documentos preparados en forma de
hipertexto se entrelazan mediante un grupo seleccionado de palabras o frases.
Puede manejar distintos formatos de texto y otros objetos, imágenes, bases
de datos, etcétera.
Un hipertexto para ambiente de red, permitía
enlazar automáticamente documentos entre si, ubicados en diferentes computadoras.
El hipertexto cambia significativamente el paradigma tradicional en el que se
utiliza un documento cada vez y cada documento es completamente independiente.
El resultado es una red que interconecta recursos de información a nivel
mundial.
Web opera sobre una arquitectura cliente- servidor. El software
server almacena y el software cliente busca y recupera. El cliente también
ofrece una interfaz para el usuario final. Cada uno de estos software pueden perfeccionarse
de forma independiente.
Un servidor web es un programa receptor de
solicitudes de documentos hipertextos residentes en su computadora y el encargado
de enviarlas a la máquina que los solicita; el cliente web, es el encargado
de enviar las solicitudes hechas por el usuario a la computadora que opera como
servidor y visualizar las recibidas en pantalla.
El WWW toma un enfoque
algo diferente a Gopher y WAIS. El usuario comienza su navegación dentro
de un documento (que puede ser multimedia). Las frases subrayadas o destacadas
dentro del documento indican enlaces con otros documentos o recursos, con información
relacionada, que pueden estar almacenados en cualquier punto de Internet y accederse
con una simple pulsación del ratón.
El HTTP o protocolo
de transferencia de hipertexto permite llamar a cualquier tipo de página
web, se utiliza para transferir ficheros escritos en un idioma normalizado.
El HTML es un lenguaje desarrollado para el diseño de páginas
y documentos cuya consulta se realizará en el web. Se emplea para describir
y reconocer los documentos hipermedia en el web, se basa en un sistema de etiqueteado.
Este lenguaje es una aplicación de SGML (Standard Generalized Markup Languaje)
o norma ISO 8879, un lenguaje mucho más amplio para la definición
de lenguajes de formateo de documentos, establecida en 1986.
Utiliza una serie de marcas predefinidas que indican, tanto el comienzo y el final de cada una de las partes que distinguen un documento (título, subtítulo, notas al pie de páginas y otros) como las características tipográficas (tipo de letra, tamaño, etc.).
En este sentido, un documento en
HTML puede enviarse desde una máquina a otra en forma de una cadena simple
caracteres ASCII, reconstruirse y aparecer ante su solicitante con toda su riqueza
original.
Los documentos HTML utilizan etiquetas para indicar el formato
y la estructura de la información del documento que se presenta al usuario.
Existen dos tipos de etiquetas básicas, asociadas a cada una de las instrucciones:
las de comienzo y las de fin.
El lenguaje HTML consta de dos tipos
de instrucciones: para presentar y estructurar el texto que se mostrará
al usuario y para establecer los enlaces hipertextuales a otros documentos en
Internet, utilizando los URL.
La propiedad más importante del
HTML es su posibilidad de enlazar partes de un texto con otros documentos o con
otras secciones del propio documento. El programa visualizador resalta de alguna
manera (usualmente con color diferente o subrayado) los enlaces para indicar su
condición de enlaces hipertextuales. Estas secciones o documentos pueden
ser textos, imágenes animadas o no, en blanco y negro o a color. Posibilita,
en general, preparar salidas, formatear, estructurar y relacionar información
y recursos.
Los software clientes comprenden HTML, y en correspondencia,
presentan la información siguiendo el formato descrito en las instrucciones
HTML incluidas en el texto y recuperan y muestran la información demandada
por el usuario cuando actúa sobre los enlaces hipertextuales a otros ficheros
del hiperespacio.
Sin embargo, la creación de un sitio W3 requería
de una gran cantidad de trabajo porque los documentos debían etiquetearse
de acuerdo con las reglas de Hypertext Markup Languaje (HTML). Debido a esta razón,
W3 permaneció ocioso hasta que un equipo del National Center for Supercomputing
Applications (NCSA) desarrolló un browser, el Mosaic, capaz de reconocer
el formato de los textos y las imágenes. A partir de aquel momento, comenzó
el crecimiento explosivo del uso del WWW para la implementación de los
sitios.
Aunque el WWW estuvo disponible desde 1991, el amplio uso
que en la actualidad recibe el WWW es el producto de la aparición de Mosaic,
el primer programa browser, en la primavera de 1993. A este le siguió el
Netscape. El Mosaic y el Netscape se desarrollaron originalmente para trabajar
en servidores UNIX; un sistema operativo dominante en el mundo de Internet. Sus
versiones para clientes aparecieron rápidamente para el DOS/WINDOWS (primero
para 16 y después para 32 bits) y la Apple Macintosh. Desde el lanzamiento
del sistema operativo Windows 95 por la Microsoft, la estrategia de esta compañía,
dominante en la industria mundial de microcomputadoras, fue la de promover su
propio browser, el Internet Explorer.
Los clientes web se diseñan
generalmente para plataformas software - hardware específicas. El término
browser se usa con frecuencia como sinónimo de cliente web. Por ejemplo
Mosaic para ambiente Windows, Macintosh y Unix.
Los browsers, desarrollados
para las plataformas más populares (las de PC, de Macintosh, etc.), actúan
como intérpretes en el web. Permiten la obtención y lectura de los
documentos ubicados en los servidores hipermedia de Internet. Los documentos hipermedia,
que visualizan los programas browsers, contienen enlaces que actúan como
pequeñas puertas que ofrecen al usuario la posibilidad de consultar otros
documentos aunque éstos se encuentren almacenados en otras máquinas,
ciudades o países. Los browsers, responsables, en gran medida, por el desarrollo
de Internet, son las principales herramientas para el acceso a esta red.
Web
es un concepto, Mosaic es un browser que opera sobre web. La habilidad de un browser
para seguir los enlaces, visualizar gráficos multicolores, generar sonidos,
procesar textos, con una interfaz coordinada requiere gastos significativos en
software. Los servidores web se identifican por medio de una pantalla introductoria
denominada Home Page.
El éxito del Mosaic alimentó la
ambición y el deseo de independizarse del NCSA entre sus creadores. El
nuevo grupo creó una versión perfeccionada - el Netscape - que disfruta
de gran aceptación en la comunidad de Internet. De repente, el W3 se convirtió
en el instrumento de publicación de elección. El escenario actual
de Internet es el producto de estos avances recientes.
En la primavera
de 1993, M. Gray, entonces un estudiante del Massachussetts Institute of
Technology (MIT) escribió un programa llamado Wanderer para recorrer el
web y contar sitios.
En junio de ese año, Wanderer había
identificado 100 servidores WWW que contenían mas de 200 000 documentos
hipertextos. La motivación inicial de M. Gray fue descubrir nuevos
sitios, en los tiempos cuando web era un pequeño espacio. Uno de sus resultados
fue Comprehensive List of Web Sites (Lista Exhaustiva de Sitios Web).
Wanderer
recorrió sistemáticamente el web desde junio de 1993 a junio de
1995 y fue el primer agente, araña o autómata, y uno de los predecesores
de los software robots que mas tarde se diseñaron para construir los índices
actuales al WWW como Lycos, Altavista, Hotbot, etc.
Le siguieron las
denominadas guías. Las Guías Internet son un producto de Internet
Resource Discovery Project (IRD) patrocinado por la Universidad de Michigan. En
noviembre de 1994, existían más de 120 guías temáticas
disponibles.
Estas guías pueden verse como catálogos
de tópicos específicos. Cada documento contiene una lista de archivos,
host Gopher, listas de correo electrónico, grupos de interés especial,
grupos de discusión, grupos de noticias, servers Web y WAIS, murales, etc.
todos los cuales son relevantes a áreas temáticas particulares o
a disciplinas académicas. Por el contrario, las listas de Internet se organizan
alfabéticamente o por el modo de acceso y no generalmente por materias.
Las guías sirven para la referencia. Ofrecen comúnmente dirección
postal, número de teléfono y de fax de las personas a contactar,
así como comentarios explicativos asociados con cada recurso. Estos recursos
pueden ser de valor porque nadie tiene acceso a cada espacio de Internet. Es posible
consultar el índice alfabético de las guías, realizar búsquedas
a texto completo, seleccionar documentos por categorías en múltiples
temáticas y utilizar una serie de documentos auxiliares tales como guías
de guías, metaguías y otros. Un individuo puede también descargar
estas guías en su máquina y realizar búsquedas por palabras
claves en ellas.
Sin embargo, estas guías o facilidades- como las del FTP- no solucionaron completamente los problemas de accesibilidad.
Uno
de los primeros intentos por facilitar un acceso más universal a los recursos
disponibles en Internet, fue Archie. Archie, un sistema diseñado por la
Universidad de Mc Gill en Toronto, Montreal, permitió crear y mantener
un índice de cada uno de los directorios y ficheros - de datos, de programas
u otros disponibles en los servidores de FTP anónimos accesibles en todo
el mundo. Archie mantenía una base de datos con las referencias de los
ficheros y las rutas para acceder a ellos, así como posibilita que sus
usuarios realicen búsquedas en dicha base de datos. Archie permitía
realizar búsquedas de las cadenas de texto que aparecen en sus índices
y proveer al usuario con la dirección del recurso donde esta se hallaba
y ruta del directorio de cada recurso recuperado.
Aparecieron, a su
vez, otros motores de búsqueda como Verónica y Jughead. Los motores
de búsqueda experimentaron un rápido crecimiento en número
y potencia. Actualmente se dispone de motores de metabúsqueda, es decir,
de una plataforma de software que opera por encima de los motores de búsqueda
existentes.
Existen dos tipos básicos de motores de búsqueda.
La diferencia entre estos directorios radica en su forma de indizar las páginas.
Los primeros organizan la información en forma jerárquica y los
segundos, a la manera de conceptos. Uno de los primeros directorios jerárquicos
en crearse y de los más importantes en desarrollo es Yahoo! (http://www.yahoo.com).
En este, se almacena la información en categorías que forman una
jerarquía. Entre los directorios que ordenan la información en conceptos,
uno de los más importantes y con un crecimiento espectacular es el AltaVista
de Digital (http://www.altavista.digital.com) donde se indizan las páginas
mediante palabras claves o frases.
Para realizar una búsqueda
por medio de un motor jerárquico, es necesario escoger las categorías
temáticas generales que se correspondan, en un primer nivel, con las materias
objeto de exploración en la página principal (HomePage). A continuación
de esta primera selección, aparecerá una lista de las subcategorías
relacionadas con las temáticas escogidas anteriormente y así sucesivamente
hasta obtener el nivel de especificidad deseado.
Para ejecutar una
búsqueda con un motor del segundo tipo, se tecleará la palabra clave
o frase que representa la temática en la que se realizará la exploración
en el espacio que para esto se destina en la página principal. El sistema
recuperará mediante su propio índice las páginas que cumplen
con la prescripción de búsqueda formulada. Una vez concluida la
exploración presentará sus resultados en una página que contiene
la identificación y la dirección de los documentos relevantes. Las
búsquedas en motores en este tipo de motor aceptan el empleo de operadores
lógicos, asteriscos y otros recursos similares con el fin de precisar cuanto
sea necesario sus resultados.
La creación del WWW, abrió
un gran potencial para la distribución de los documentos electrónicos.
Se desarrolló el protocolo HTTP, el TCP/IP y el HTML. Se creó el
sistema universal de identificación de los recursos- el URI. Aparecieron
los robots o agentes autómatas que indizan los recursos, mediante la extracción
de palabras claves. Ellos permiten la recuperación de recursos, a partir
de estrategias prelaboradas de búsqueda . Se estableció un modelo
normalizado para la representación y recuperación de información
en Internet, así como para crear Intranets compatibles.
El URI
(Universal Resources Identificator) tiene funciones semejantes a las del ISBN
y el ISSN. El creador de un documento o de un servicio que desee que este aparezca
en la base de datos de un localizador de recursos, deberá solicitar que
se le asigne un identificador que distinga al documento universalmente y un URL
(Universal Resources Locator) que posea los datos de su ubicación. Una
vez relacionados ambos en un base de datos mediante enlaces lógicos, es
posible buscar, como si tratara de un Archie por el URI y obtener como respuesta
su URL.
El URL es un localizador o localización. Esencialmente
es una dirección en el ciberespacio. Especifica la ruta de acceso al recurso,
el sitio y su ubicación en este. La identificación de los recursos
electrónicos requiere de la existencia de normas para la identificación
unívoca de los recursos, es como una especie de ISBN. Esta tarea de normalización
la desarrolla IEFT (Internet Engeenering Task Force), que se encarga de la creación
de nuevos protocolos en Internet mediante un conjunto de normas denominadas URIs
(Uniform Resources Identifiers). Son particularmente interesantes el URN (Uniform
Resources Names) que es un código alfanumérico único y permanente
que identifica de forma unívoca a un recurso dentro de Internet.
La
combinación del URL con el HTML permite el desarrollo de una capacidad
de hipermedia potente y distribuida.
En el web, se combinan los principios
del hipertexto con la capacidad de localizar información (hipermedia) en
cualquier parte del mundo. Es una iniciativa para la recuperación de información
hipermedia en un área amplia para proveer acceso universal a un amplio
universo de documentos. Un nuevo protocolo de comunicación, el HTPP que
solicita y recibe documentos de host remotos en la red y posibilita la realización
de saltos hipertextuales que los anteriores protocolos no permitían. Enlaza
ficheros de textos y multimedia, documentos o programas de recuperación
de información almacenados en diferentes computadoras conectadas a Internet
en todo el mundo.
Es el intento más avanzado de crear una herramienta
acceder toda la información disponible en Internet como si fuera un único
documento en el que se enlazan sus diferentes partes mediante las relaciones hipertextuales.
Las principales ventajas de Web respecto a Gopher son que su protocolo,
el HTTP, integra el resto de los protocolos que configuran Internet, incluido
Gopher; además rompe la rigidez de Gopher al basarse en un sistema hipertexto
en el que el usuario salta de un documento a otro relacionados por sus temas.
Permite, a su vez, el trabajo con documentos multimedia en los que se integran
texto, sonido e imágenes. Permite al usuario cierto grado de interactividad
o diálogo con el servidor mediante formularios. El sistema no se basa en
una estructura de menús, sino en documentos que se enlazan entre ellos.
Para la realización de estos enlaces se utiliza el HTML. La inmensa parte
de las revistas se distribuyen hoy mediante web.
Hoy, se normalizan
los procesos de edición con el fin de lograr uniformidad en los criterios
de registro, transferencia y recuperación de la información. Un
ejemplo de ello lo constituye el desarrollo de herramientas de edición
electrónica y de lenguajes como el HTML y el SGML con el propósito
de crear documentos normalizados que faciliten su consulta, lectura, exportación
y exploración.
Para las bibliotecas y los profesionales de la
información esto significa que los servicios anteriormente independientes,
separados entre si como Telnet, FTP, Gopher, WAIS pueden presentarse ahora como
un modelo simple de datos uniformes. El espacio web incorpora el espacio Gopher,
el espacio Telnet, el espacio FTP y el espacio WAIS a la facilidad añadida
de la capacidad multimedia. Es una increíble oportunidad y cambio para
la gestión de información.
El World Wide Web es la responsable
del crecimiento espectacular y popularidad actual de Internet.
Una
publicación en mayo de 1994, introdujo a los lectores en el nuevo concepto
de WWW.
A partir de 1993, con WWW, el éxito definitivo, se percibe
la potencialidad de Internet, comienzan grandes inversiones del sector privado
en la red. Con el advenimiento de WWW, se hizo evidente el potencial de la red
para la comercialización electrónica. La columna vertebral principal
de Internet pasó a principios de los 90 de solo entidades gubernamentales
como la NSF a manos privadas como las de AT&T y otras. Se hizo evidente su
potencial para utilizarla en funciones mas serias de los negocios como para solicitar
productos, ordenar pagos, almacenar solicitudes y otras.
Para aquel
entonces, hacía más de cincuenta años que se había
comenzado a pensar en una base de datos de información universal, con acceso
a todos y en la que mediante enlaces semánticos entre los documentos los
usuarios pudieran hallar con rapidez la información buscada. En 1938, H.
Wells había propuesto la idea de la creación de un cerebro mundial,
donde se registrara todo el conocimiento acumulado hasta el momento, de una gran
bibliografía mundial. Esta era una vieja idea de los bibliógrafos.
Sin embargo, fue necesario que transcurrieran varias décadas para que surgieran
los medio tecnológicos capaces de soportar tal volumen de información.
En este sentido, el desarrollo de las bases de datos bibliográficas
en línea constituyó un paso importante en la actividad del sector
de la información. Estos recursos, localizados centralmente, facilitaban
la recuperación de información actualizada mediante el uso de las
tecnologías de computación y las telecomunicaciones. Posteriormente,
el crecimiento de las capacidades de almacenamiento en los medios individuales
de trabajo y el desarrollo de los sistemas de recuperación permitió
el acceso descentralizado con facilidad. Llegar a la red significó desarrollar
primero las computadoras, después las capacidades de almacenamiento y finalmente
las telecomunicaciones. Con la institucionalización de la red, se ha producido
un cambio en la concepción del desarrollo de colecciones, la labor de identificación,
la búsqueda de los recursos es cada vez más importante y la adquisición
significa posibilidad de acceso.
Se reconocen tres etapas en el desarrollo tecnológico de los sistemas de información:
En
las dos primeras etapas, las tecnologías cambiaron las operaciones en el
contexto de la compañía. En la tercera, las operaciones entre las
compañías. En el ambiente bibliotecario, se ha producido un cambio
en las concepciones de desarrollo de las colecciones, la labor de identificación
y de búsqueda de los recursos se ha convertido en la más importante.
Adquirir significa la posibilidad de acceder a un recurso determinado.
De la misma forma que 1995 fue el año de Internet, 1996 fue el año de las Intranets. Estas redes son una especie de mininternets que se instalan dentro de una organización o compañía que proporciona enlaces internos y a Internet en general.
Tecnológicamente, constituyen
una evolución lógica de las redes locales y amplias que eliminan
las limitaciones propias de sus precursoras. Presentan, como valor añadido,
la posibilidad de conectarse a los enormes recursos de información y de
comunicación que ofrece Internet.
El concepto de intranet se
refiere a la aplicación de las herramientas utilizadas en WWW a la configuración
de la red local para posibilitar la gestión de la información interna.
Gestionar la intranet de una empresa le permite al centro de documentación
convertirse en el articulador de la información de los distintos departamentos
de la organización y, a la vez, en su nexo con el exterior.
De
esta manera, las ventajas propias de Internet se trasladan al entorno inmediato
de la organización: navegación asociativa e intuitiva, amigabilidad
de la interfaz, multimedia, integración con los recursos externos de información
presentes en Internet y otras.
Una de las ventajas de la gestión
de información en una plataforma web es la posibilidad de integrar los
recursos de información internos con los externos, presentes en Internet,
en un mismo entorno. La selección y gestión de los recursos de información
que ofrece Internet, relacionados directamente con nuestro segmento de actividad,
puede ser un buen servicio complementario, sobre todo para los centros de documentación
o bibliotecas especializadas que actúan como un "filtro" necesario
ante la acumulación de información irrelevante para nuestros usuarios.
La creación de una red local o intranet permite integrar y
estructurar los recursos de información internos y externos de la colección
organizacional bajo una misma interfaz, fácil e intuitiva. Debemos apostar
por Internet y colaborar activamente en la resolución de sus problemas
mediante el aporte de años de experiencia de la profesión bibliotecaria
en la gestión y recuperación de información.
Mientras
que los primeros públicos para la mayoría de los sitios web fueron
los clientes externos, el potencial para servir a los clientes internos podría
igualmente ser tan grande. La creación de las redes internas para facilitar
la comunicación y las transacciones entre los empleados, los suministradores
y los contratistas independientes y los distribuidores podría ser el principal
valor de Internet para las compañías.
Un reciente artículo
sobre las intranets reveló que las ventas de software para los servidores
de las intranets habían sobrepasado las ventas para los servidores de Internet
a finales de 1995 según las compañías reconocían las
amplias posibilidades de uso de las aplicaciones de la intranet.
Una
intranet posee un gran valor potencial para la comunicación interna en
la compañía.
Hacia 1996, la Federal Communications Commission
(FCC) adquiere como su responsabilidad primaria la elaboración de la política
de telecomunicaciones en los Estados Unidos. En 1996, durante la Internet Society
International Conference en Montreal, la FCC expresó, como sus principales
preocupaciones, los problemas relacionados con el acceso a Internet y el ancho
de banda de la red.
Desde el surgimiento del embrión de la red
que posteriormente se convertiría en lo que hoy se denomina Internet, en
1969, el crecimiento del número usuarios y redes interconectadas se ha
acelerado progresivamente.
En el año 1972, existían
10 procesadores de mensajes de interfaz, a principios de los 80, cerca de 100.
El número de redes conectadas con Internet creció rápidamente,
de unas 60 en 1984, a 500 a mediados de 1988
Entre agosto de 1981
y octubre de 1991, el número de host creció de 213 000 a 617 000.
De enero de 1992 a enero 1996, de 727 000 a 9 472 000. En este período,
creció igualmente el número de sitios comerciales, superaron a los
educacionales, así como el de usuarios de Internet no estadounidenses.
Los dominios net ,organizaciones administrativas , crecieron para las redes
en el segundo semestre de 1995 a más del doble. Cerca de 76 000 sistemas
ahora se nombran??? WWW (enero 1996) de 17 000 hacía 6 meses anteriores.
En mayo de 1996, M. Gray, informó sobre la existencia de
1 93 150 servidores web. En junio de 1993, uno de cada 13 000 host en Internet
era un servidor web. En enero de 1996, eran uno de cada 94. Igualmente, sucedió
con el crecimiento de los web comerciales. En Estados Unidos, en junio de 1993,
sólo 1,5% eran dominios .com, en enero de 1996, el 50%.
Entre
los años 1993 y 1994, el tráfico de información en Internet
se duplicó de año en año.
En agosto de 1993,
existían más de 14 000 redes conectadas con Internet y según
las estadísticas de aquel momento, se incorporaban 1000 nuevas redes como
promedio mensualmente.
En enero de 1995, la cifra total había
aumentado a 26 274 redes. Habían conectados 84 países con acceso
directo a esta red y 48 millones de usuarios.
En 1995, Internet alcanzaba
a 148 de los 185 países miembros de las Naciones Unidas (86%) en comparación
con los 73 de los 159 países miembros (46%) en 1991. Las aplicaciones disponibles
cubren todos los sectores de la vida de la sociedad.
El acceso a Internet
en los mercados foráneos promete crecer rápidamente según
se expandan los servicios en línea y según se interesen más
y más los gobiernos regionales y nacionales y las compañías
de telecomunicaciones.
El crecimiento internacional a largo plazo de
Internet aumenta las oportunidades del flujo y la transacción de la información
a través de las fronteras. En 1995, el volumen de transacción en
web se estimó en más de $400 millones, en comparación con
los menos de $20 millones en 1994 - más del 80% de los cuales fueron a
compañías de los Estados Unidos.
El volumen de transacción
global alcanzó más de mil millones de dólares en 1996.
En abril de 1997, el 73% de los usuarios de Internet utilizaban WWW para
realizar sus compras. No existen dudas acerca del nacimiento de un mercado electrónico,
pero el trabajo de consolidarlo y establecer un conjunto mínimo de requisitos
y normas aún está pendiente.
En el crecimiento acelerado
de Internet han influido factores, tanto de carácter técnico como
político. Entre los primeros, se destacan el éxito de los protocolos
de la red, el progresivo abaratamiento de los microprocesadores y el triunfo de
las nuevas concepciones de organización de redes en forma descentralizada
y distribuida. Entre los factores de tipo político, aparece la acción
del gobierno estadounidense y de muchas otras naciones que han apoyado incondicionalmente
el desarrollo de una infraestructura de comunicaciones adecuada para soportar
el uso de los recursos disponibles en Internet de forma amplia.
El
rápido crecimiento de Internet se explica, en gran parte, en el éxito
del protocolo TCP/IP para conectar redes y equipos de diferentes tecnologías.
La incorporación de este protocolo en las configuraciones básicas
de los principales equipos por parte de los proveedores comerciales impulsó
decisivamente su uso.
El decrecimiento dramático de los precios
del hardware ha permitido a las compañías invertir un por ciento
menor de su presupuesto para sistemas de información en hardware. Sin embargo,
los costos del software y de su empleo constituyen un renglón creciente
de los costos totales de los sistemas de información.
En el
mundo de los negocios, el web reducirá la ventaja competitiva de las economías
de escala en muchas industrias y facilitará el trabajo de los pequeños
comerciantes para que compitan a nivel mundial. Los anuncios de publicidad como
una barrera para entrar, se reducirán en la medida que el web posibilite
alcanzar una audiencia global de forma más económica.
Una
pequeña compañía puede convertirse rápidamente en
un gran jugador internacional al aprovecharse de las tecnologías que permiten
determinar las formas en que reaccionan los clientes o sus necesidades.
Las
ventajas de tamaño de las grandes compañías desaparecerán.
El apoyo y la cooperación gubernamental foráneas determinarán
cómo evolucionarán los negocios internacionales por medio de Internet.
Las iniciativas tomadas por algunos gobiernos, asociaciones del comercio y compañías
de telecomunicaciones son un buen presagio para la futura expansión.
Es incorrecto considerar a Internet simplemente una opción adicional
para la estrategia de los negocios, aunque este pueda ser la práctica actual
de muchos. Pocos negocios han reconocido el potencial de Internet y sus oportunidades
para la comunicación bidireccional -entre la compañía y sus
usuarios- como una ventaja seria.
Las cuestiones de seguridad ocuparon
el primer lugar en las agendas de trabajo de las compañías que buscan
obtener una presencia en Internet. La renuencia de muchas compañías
ha utilizar Internet tiene su fundamento en el temor a comprometer información
interna de negocios.
En materia de publicaciones electrónicas,
las redes teleinformáticas de alcance mundial se constituyeron un nuevo
canal de comunicación útil para la distribución de información
a millones de personas. Sin embargo, dicha distribución, no implica la
realización de una publicación. Para que un documento se considere
una publicación se requiere de que este transcurra por un proceso de arbitraje
y edición que valide su contenido y metodología y adecue su presentación
a las normas que para ello la ciencia exige.
El Directory of Electronic
Journals, Newsletters and Academic Discussion List, el primero y más completo
de los directorios de revistas electrónicas en el mundo que comenzó
a publicarse en julio de 1991 por la Association of Research Libraries, recogió
en su quinta edición de mayo de 1995 mas de 675 revistas científicas
y boletines electrónicos, lo que supone un incremento del 40 % con respecto
a la edición anterior de 1994.
En un primer momento, la forma
de distribución de estas publicaciones fue mediante el correo electrónico,
los servidores FTP y sobre todo de los Gopher. Sus limitaciones eran importantes,
por ejemplo, el correo electrónico permitía solo la distribución
de documentos en formato ASCII.
EL Gopher se extendió rápidamente.
Más adelante, con la aparición del WWW y su ventajas con respecto
a Gopher, las revistas existentes comenzaron a migar a servidores Web en un proceso
en el que al principio convivieron los dos sistemas y poco a poco se fue imponiendo
el segundo.
Por otra parte, hacia 1996, se produjeron una serie de
avances tecnológicos que permitieron pronosticar que la infraestructura
de televisión por cable constituirá el soporte fundamental para
la implementación de servicios multimedia a nivel mundial. En particular,
dichos sistemas forman una plataforma de uso general para los servicios bidireccionales
como el acceso en banda ancha a Internet, y la transmisión de datos y voz.
Ellos presagiaron el nacimiento de poderosísimas tecnologías de
comunicación, propias de un nuevo escalón de desarrollo, Internet
2, que servirían para enfrentar los nuevos retos que plantean el acceso
de millones de personas a la red.
El web ha transformado radicalmente
la forma en la cual se comunican las personas. En el futuro, probablemente se
considerará un adelanto comparable a los de la radio y la televisión
en su tiempo.
Internet constituye un fenómeno de enorme importancia
actualmente, cuyo impacto es comparable al que tuvo para el sistema feudal el
descubrimiento y uso de la pólvora. Sus efectos han generado cambios trascendentales
en todas las esferas de la vida de la sociedad moderna.
Conceptualmente,
Internet es una red de redes de comunicación con alcance mundial que posibilita
a sus usuarios el intercambio y el acceso universal a los recursos de información
de manera sencilla e interactiva.
Una de las mayores críticas
que enfrenta Internet es la carencia de una organización y una estructura.
Los usuarios encuestados perciben una necesidad real de mejores directorios en
Internet, creados por personas con algún conocimiento sobre indización
y catalogación.
Muchos de los directorios en Internet son generados
por individuos con un gran conocimiento en computación pero desconocedores
de los problemas relacionados con la organización de la información.
Internet podría ser mucho mas amistosa si las pantallas para los usuarios
finales las diseñaran los profesionales de la información. La definición
de mecanismos precisos de búsqueda y recuperación es un aspecto
esencial para la evolución satisfactoria de Internet. Los métodos
empleados actualmente, donde no existe control del vocabulario y la información
no se halla estructurada, no ofrecen un resultado adecuado.
Directorios
como Yahoo y Magellan, basados en la clasificación humana de los recursos
informacionales de la red, no son capaces de seguir su crecimiento vertiginoso.
Estos presentan problemas que se derivan de la acción de la subjetividad
humana, así como del empleo de interminables categorías y subcategorías.
Su mayor virtud es la precisión en los resultados de las búsquedas,
aunque la posibilidad de "silencio" documental es alta.
Otra
alternativa es la utilización de directorios elaborados por robots que
realizan una indización automática a texto completo, en la que los
resultados de la búsqueda se ordenan con frecuencia según su nivel
de relevancia a partir de algoritmos matemáticos que normalmente emplean
la repetición del término buscado en el documento completo o en
determinadas zonas del mismo para su clasificación. El problema es el inverso:
gran exhaustividad (resultados de miles de registros), pero el "ruído"
que se produce es excesivo.
La única posibilidad para solucionar
este problema al menos parcialmente es el uso de buscadores que permitan acotar
los resultados de nuestras estrategias de búsquedas mediante operadores
booleanos y de proximidad. Altavista, Excite, Open-Text y Lycos pertenecen a este
tipo de motores de búsqueda.
Altavista es la herramienta más
completa, potente y precisa para la recuperación de información
en el Web. Incluye la mayor parte de los recursos empleados tradicionalmente en
la recuperación de información: operadores booleanos, de proximidad
o adyacencia; así como la posibilidad de truncar a la derecha y por caracteres,
limitar por fechas, palabras en el título y otras.
Pero, el número
de motores de búsqueda crece aceleradamente su número, como ocurrió
con las bases de datos en el pasado, que se multiplicaron tanto que hicieron prácticamente
imposible la búsqueda, sin contar los altos índices solapamiento
entre ellas.
La última opción son los metaíndices
o motores de búsqueda múltiples que interrogan a otros buscadores
y eliminan posteriormente los documentos duplicados. Aunque proporción
una mayor exhaustividad, no responden al problema de fondo: la precisión
de los resultados.
La solución al problema es difícil,
si se considera que el crecimiento de la información ocurre de forma exponencial
y, gran parte de ella posee un carácter eminentemente comercial. Una de
las propuestas para resolver dicho problema es la creación de sistemas
distribuidos de indización en los que los administradores de cada web realizarían
la indización de sus páginas. La indización se aparecería
en un fichero normalizado que recuperaría un robot para alimentar una base
de datos global. Este fichero contendría una serie de campos semejantes
a los de una ficha catalográfica.
Para esto, es necesario una
normalización, establecer como describir un recurso, como clasificarlos,
como indizarlos correctamente. Ello es vital para una buena recuperación,
los lenguajes permutados serán esenciales para aumentar los índices
de recuperación. Si todo esto no funciona, la recuperación será
cada vez más deficiente.
Es indispensable igualmente que cada
una de las profesiones y las bibliotecas establezcan sólidos criterios
para la validación y la selección de los recursos de información,
porque el desperdicio informacional crece aceleradamente. En el sector de la medicina
clínica , existen notables avances en este sentido, con los trabajos realizados
por el llamado club de Vancouver y las organizaciones vinculadas con el ejercicio
de la medicina basada en evidencias. Hoy la mayoría de los sitios colocan
sus recursos en la red sin que para ello medie un proceso de arbitraje previo.
En Internet falta más la presencia de bibliotecarios, generalmente
olvidados de muchas actividades de la sociedad y que poseen la mayor experiencia
en la organización del conocimiento.
Después de una pobre
organización, la carencia de datos autorizados, clasifica entre las preocupaciones
principales de los bibliotecarios. A menudo, no aparece cómo se recolectó
la información o sus fechas, propiedades cruciales para los bibliotecarios
en los negocios. Otra limitación es la existencia de demasiada información;
Internet es para personas con tiempo suficiente para explorar a través
de información irrelevante hasta hallar la deseada. Cada vez resulta mas
difícil hallar la información que se requiere en Internet. En este
sentido, los bibliotecarios tienen mucho que aportar en la Era de la Información,
porque ellos han manipulado información durante siglos.
Las
bibliotecas del sector de las finanzas, del comercio y de los negocios están
entre las más afectadas por esta situación. Ellas han estado en
la primera fila de los cambios tecnológicos y administrativos en el mundo
de la información. Dentro de este el sector, el de las finanzas es el más
influyente, porque cualquier cambio en el repercute rápidamente en otros
sectores de la economía y la sociedad. Este emplea en Inglaterra, por ejemplo,
más profesionales de la información que otros sectores. Sin embargo,
la carencia de información confiable en la red es uno de los factores que
influye decisivamente en su consideración como un medio secundario, cuando
de hallar información autorizada se trata.
Internet promete
revolucionar la dinámica del comercio internacional y al igual que el teléfono
y los equipos de fax, podría ser una fuerza principal en la democratización
del capitalismo. Las pequeñas compañías serán capaces
de competir más fácilmente en el mercado global y los consumidores
en los mercados emergentes en particular, se beneficiarán del un número
crecido de productos, servicios e información a los cuales la Internet
les dará acceso. Internet desaparece muchas barreras de la comunicación
entre los clientes y los empleados al eliminar los obstáculos creados por
la geografía, las zonas de tiempo y la localización y crea un ambiente
de negocios sin fricciones.
Es el momento en que se han hecho realidad
las ideas, las concepciones de hace décadas y se pasa del papel al soporte
electrónico. La biblioteca como institución ha alcanzado su clímax
con el paso a una nueva etapa de su desarrollo: la biblioteca virtual, sin papel
y sin paredes.
Internet no es solo una red para la transmisión
de información científica sino un medio de difusión masiva
por el que una gran parte de la información que transita no es académica.
Con el desarrollo de aplicaciones que conciben a la red como una gran base
de datos distribuida, el acceso a la información se ha visto más
favorecido que la comunicación. Sin embargo, nuevos progresos podrían
restablecer el dominio de las comunicaciones sobre el acceso a la información.
Internet puede estar transformándose en un nuevo dispositivo para la publicación,
en la medida en que responde cada vez más a la agenda de las diferentes
compañías establecidas en el ciberespacio y cada vez menos a las
necesidades de los individuos que desean mantenerse en contacto. El advenimiento
de Java, un software para la publicación, refuerza esta tendencia. No obstante,
nada es seguro. Suceda lo que suceda, siempre existirá espacio suficiente
para aquellos que prefieren comunicarse en lugar vez de recibir información
según las estrategias de los medios de radiodifusión. De cualquier
forma, Internet es un medio inadecuado hasta el momento para la difusión,
hecho el cual podría salvarla de caer en la trampa de la radio o la televisión.
Fuera del contexto de las aplicaciones, Internet se enfrenta a una batalla
recurrente con los grupos o compañías que intentan crear redes que
funcionan como circuitos y que, por lo tanto, facilitan un mayor control, sea
este político o económico, en comparación con el TCP/IP.
El debate actual sobre el ATM difiere de las primeras batallas entre el X.25 y
el TCP/IP que ya no lucha por la supervivencia. Sin embargo, se puede concebir
un despliegue inicial del ATM que utilice TCP/IP y, en forma gradual, introducir
aplicaciones propias de esta nueva tecnología. Finalmente, ATM podría
dominar la transferencia de información en Internet y el TCP/IP constituirse
en un sector del ATM.
De igual forma que Internet revolucionó
las comunicaciones a nivel mundial, el Asynchronous Transfer Mode (ATM) aporta
actualmente un nuevo sentido a las redes de alta velocidad. El ATM representa
a una nueva generación de redes. Promete ser un medio clave en las redes
para el empleo tanto de las aplicaciones existentes como emergentes en los campos
de la ciencia, la medicina y la educación.
La fusión
de las compañías telefónicas y de televisión por cable,
el empleo de una tecnología como el ATM para la conmutación y el
transporte de la información, así como de sistemas de comunicación,
cada vez más potentes, posibilitan el envío de datos, voz y vídeo
mediante un solo medio físico en tiempo real de forma tal que exista una
sola red capaz de proporcionar a los usuarios - pequeños, medianos y grandes-
los servicios que demandan.
Se ha entrado a una nueva era cultural,
la era del acceso instantáneo a cualquier lugar del mundo, la era en la
que existe, por primera vez en la historia, una total libertad para la comunicación
y el flujo sin limitaciones de información, la era en que todas las culturas
podrán enlazarse por medio de las computadoras para conformar una inteligencia
colectiva que llevará a cambios fundamentales en las respuestas culturales,
políticas y sociales de los pueblos.
El futuro de la Internet
Society dependerá, en gran medida, de su capacidad de crear y perfeccionar
sus protocolos rápida y eficientemente. La solución del problema
del direccionamiento y el aumento de la seguridad de las transacciones en la red
son las primeras prioridades del perfeccionamiento de Internet. En los años
90, el establecimiento de una Internet Society fue un paso muy importante en esta
dirección que pronostica un buen futuro a un sistema mundial que debe permanecer
aislado de influencias políticas, económicas o ideológicas.
El sector de las telecomunicaciones experimenta actualmente un proceso
de desregulación y privatización. La necesidad de atraer inversiones
foráneas directas para incrementar el número de líneas telefónicas
de las economías en desarrollo, así como de modernizar y potenciar
subsectores como la telefonía local y de larga distancia, la televisión
por cable y la transmisión por satélite, han generado una convergencia
de las telecomunicaciones, la visión y la inversiones mundiales durante
la década de los años 90. En un tiempo relativamente corto, los
satélites se han convertido en una parte esencial de la comunicación
global. El primer satélite de televisión, el Echo, se lanzó
al espacio en 1960.
De cierta forma, el TCP/IP es el idioma que emplean
como vehículo para comunicarse las computadoras en el mundo, razón
por la cual, al igual que cualquier otro idioma, debe situarse por encima de las
actividades humanas, de forma tal que facilite y mejore su eficiencia. Nadie desearía
que el español, el inglés o el francés pasara a propiedad
de una entidad política o comercial. De igual forma, nadie desea que el
TCP/IP se convierta en una herramienta propiedad de un grupo, compañía
o país en particular. El pertenece a toda la humanidad; por lo tanto, debe
preservarse, valorarse y perfeccionarse continuamente.
Las telecomunicaciones,
la tecnología de las computadoras personales y la televisión convergen,
tanto a nivel de la red como de las aplicaciones. La tecnología y las aplicaciones
de las computadoras personales cada vez soportan mejor el audio y al video mientras
que la televisión es cada vez más interactiva. Las redes de telecomunicaciones
y los servicios de radiodifusión progresan en la esfera de las aplicaciones
multimedias interactivas. Un aspecto clave para el rápido crecimiento de
estos nuevos servicios y de las aplicaciones es la disminución del costo
de las comunicaciones.
En estas condiciones, los métodos bibliotecarios
y de la ciencia de la información, que se desarrollaron cuidadosamente
durante décadas, han perdido su habilidad, elegancia, precisión
y aplicabilidad como consecuencia del rápido, caótico y espontáneo
de desarrollo de Internet. Los documentos, resultantes de la búsqueda a
la que se hizo referencia con anterioridad pueden ser diferentes en carácter,
extensión y calidad. Por lo tanto, se carece de la posibilidad de realizar
comparaciones entre ellos. Esta característica de Internet no sólo
afecta a los estudios de bibliotecas y de información sino que también
cambian los términos de conceptos profundamente enraizados y estructurados
como son las técnicas de indización y la lógica booleana
en la cual se sustenta el poder de los operadores lógicos.
El desarrollo descontrolado de las ofertas para realizar búsquedas de información en el web, como la que posibilitan los denominados motores, con frecuencia, genera que una misma solicitud se interprete e indice de forma diferente por cada uno de estos sistemas, la cual no siempre se explica con claridad. Si a esto se une, la forma específica de la aplicación de los operadores lógicos en las búsquedas, se puede decir que existen motivos suficientes como para desconfiar de lo que se busca y lo que se encuentra en Internet. Se conoce que en Internet en materia de información hay "oro" por descubrir; el problema radica en que es casi imposible estimar, por anticipado, cuántos de ellos pueden distinguirse con este calificativo. En la práctica, los usuarios pueden perder una gran cantidad de tiempo en la búsqueda de lo que realmente necesitan.
Recibido: 16 de diciembre del 2003 Aprobado: 7
de enero del 2004
Lic. Rubén Cañedo Andalia
Red Telemática
de Salud en Cuba (Infomed). Centro Nacional de Información de Ciencias
Médicas. Calle 27 No. 110 entre N y M, El Vedado. C P 10 400, Ciudad de
La Habana, Cuba. Correo electrónico:
ruben@infomed.sld.cu
1 Licenciado en Información Científico-Técnica y Bibliotecología. Red Telemática de Salud en Cuba (Infomed) Centro Nacional de Información de Ciencias Médicas.