Conceptos básicos de la tecnología internet

HTML (HiperText Markup Language). Lenguaje de marcas de hipertexto.

La ventaja del html es que soporta el hipertexto por medio de ligas, botones, hotspots, etc, lo que nos permite acceder de una página a otra, llamar videos, audio, animaciones, etc.

El concepto de hipertexto fue acuñado por Ted Nelson, en 1965, y se basa en la idea general de unos elementos de texto especiales dentro de un documento que permiten, al ser activados, enlazar con otra parte del documento o con otro documento diferente. Este sistema de relación entre documentos o partes de los mismos fue la extensión a INTERNET de los siempre usados índices o relaciones bibliográficas, pero que ahora permitía n acceder a la sección o documento referenciado de forma inmediata.

Con esta base, en 1989 un joven investigador del CERN, Tim Berners-Lee, tuvo la genial idea de crear un entorno para compartir información tal que un documento fuese accesible por cualquier ordenador conectado a INTERNET, sin importar dónde estuvieran el host servidor del documento o el host que lo solicitaba.

Además, debería ser posible enlazar mediante hipertexto diferentes documentos o recursos sin límites de localización geográfica, de tal forma que el usuario pudiera

“navegar” de forma transparente por dichos documentos, consiguiéndose así una cadena de información descentralizada.

Pero este planteamiento requería nuevas especificaciones, nuevas formas de comunicar diferentes equipos informáticos, nuevas implementaciones de carácter general. Así que en CERN, la NSCA y diversos organismos pusieron manos a la obra, y el resultado fue:

1. Para poder transferir de forma adecuada los diferentes documentos de hipertexto por INTERNET se creó un protocolo de red específico, el HTTP (Hipertext Transfer Protocol), basado en el envió de documentos de texto plano en formato ASCII y de ciertas cabeceras que aportan la información necesaria para la transmisión.

2. Para poder identificar un documento o recurso de Internet de forma unívoca fue necesario asignar a cada uno de ellos una especie de dirección única, que se denominó URL (Uniform Resource Locator), que indica tanto la localización exacta del recurso como el protocolo necesario para su transferencia. La forma genérica de la URL de una página web es:

http://www.servidor.dominio/carpeta/pagina.html

Como por ejemplo: http://www.htmlweb.net/redes/redes.html

Aunque en realidad la parte dominio corresponde con la tecnología TCP/IP la cual se denomina dirección IP.

3. Para poder dar formato a los datos presentes en el documento Web se desarrolló un lenguaje específico, el HTML (HyperText Mark – up Language –Lenguaje de Marcas de Hipertexto), que permitía asignar un formato especial de presentación a los elementos del documento contenidos entre unas etiquetas especiales, denominadas marcas o tags.

4. Por último, para poder interpretar y visualizar correctamente los documentos así creados fue necesario crear unas interfaces específicas, que se denominaron browsers (navegadores) como podrían ser Netscape, Explorer,

Mozilla o Firefox. Dichas páginas general mente son realizadas con el lenguaje llamado HTML y puede incluir textos, gráficos y archivos multimedia. Todos ellos se encuentran en un servidor al cual se le puede solicitar la información en cualquier momento y el navegador la despliega de acuerdo a las instrucciones que tiene el documento HMTL.

Estos fueron los pilares esenciales de los cuales se construyó la WWW (World Wide Web), la gran telaraña mundial de páginas Web (documentos Web visualizados en un navegador). El WWW es un sistema de información global, público e independiente, mediante el cual un usuario cualquiera puede acceder a documentos HTML almacenados en diferentes servidores ubicados en cualquier parte del mundo, pudiendo saltar de un servidor a otro de forma instantánea mediante los enlaces de hipertexto contenidos en las páginas Web.

El protocolo HTTP se encuentra actualmente en su versión 1.1, que mejora sustancialmente al la anterior, el HTTP 1.0, sobre todo en lo que respecta al manejo de conexiones entre navegador cliente y servidor Web, permitiendo la descarga de los diferentes elementos que forman una página Web en una sola conexión.

Estas mejoras, junto con las que ha tenido el lenguaje HTML (actualmente en su versión 4.01, de septiembre del 2001), han permitido que en la actualidad las páginas Web sean verdaderos documentos multimedia, con imágenes, sonidos y videos, algo inimaginable en los momentos de la creación de la Web, de tal forma que es frecuente encontrar ahora el término “hipermedia” evolución del concepto de hipertexto.

La mayoría de los equipos puede desplegar páginas Web, la visualización de dichas páginas depende del equipo del usuario, el monitor, la velocidad de conexión y el software utilizado para visualizar dicha página (navegador o browser). Recientemente la tecnología permite la visualización de algunas páginas en celulares, pda’s, televisores, por lo que en caso de ser necesario se deberán realizar varias versiones de un mismo sitio para su correcta visualización en los diversos dispositivos.

En toda petición de una página Web intervienen diferentes entidades: por un lado, el programa navegador en el host que realiza la solicitud y por otro lado un programa servidor alojado en un host remoto (denominado servidor Web). Ambos programas/equipos se comunican entre sí por medio del acceso a Internet que facilita un ISP (Proveedor de Servicios de Internet) y de las extensiones de red que proporciona una determinada compañía, generalmente de telefonía.

Para establecer la conexión necesaria entre ambas máquinas se utiliza una arquitectura de interconexión de redes, generalmente la arquitectura TCP/IP, en la que los datos en la transmisión van pasando sucesivamente por diferentes dispositivos de red (generalmente routers) desde el host emisor al host destino. Este sistema de comunicación, en el que un host realiza peticiones que son atendidas y contestadas por otro remoto, se denomina arquitectura cliente-servidor. El host que realiza la petición es el cliente, mientras que el host que contesta dicha petición es el servidor.

Los servidores son pues los encargados de almacenar los ficheros HTML, junto con las imágenes, ficheros CSS, ficheros javascript, etc., necesarios para la correcta visualización de la página Web. Un mismo servidor Web puede estar atendiendo a la vez a diferentes navegadores cliente.

En este entorno de trabajo, cuando un navegador cliente solicita una página web al servidor se establece una conexión entre ambos, transfiriéndose entonces los ficheros necesarios desde el servidor al navegador, mediante el protocolo HTTP. En el caso de HTTP 1.0 cada uno de los ficheros de la página precisa una conexión y descarga independiente (transacción), por lo que si la página contiene muchas imágenes, por ejemplo, el proc eso de carga de la misma se retrasa considerablemente. Este factor se ha mejorado en la versión HTTP 1.1, en la que una única conexión se mantiene para la descarga de todos los ficheros necesarios para visualizar la página solicitada.

Un factor a tener en cuenta en cuanto a HTTP es que no es un protocolo orientado al mantenimiento de estados. Esto quiere decir que cada conexión realizada entre el navegador cliente y el servidor Web es independiente, no manteniéndose variables de sesión ni de aplicación, con lo que el almacenamiento de claves, variables, etc. debe realizarse mediante herramientas auxiliares (programación en CGI, ASP, JSP, etc.).

Las páginas desplegadas se guardan temporalmente en la máquina del usuario y es lo que se le conoce como caché o archivos temporales, esto es para optimizar la velocidad de visualización del sitio la próxima vez en la que se accede a la página.

Fuente: Apuntes Desarrollo de Páginas Web de la U de Londres