|
| 1 | +# 3.1. Principios para el trabajo en la Web |
| 2 | + |
| 3 | +Cada vez que abra su navegador , escriba algun direccion URL y pulse ENTER, entonces usted verá hermosas páginas web que aparecen en pantalla. ¿Pero usted sabe lo que está sucediendo detrás de esta simple acción ? |
| 4 | + |
| 5 | +Normalmente, el navegador es un cliente , después de teclear la URL , envía peticiones a un servidor DNS, para obtener la dirección IP de la URL. Luego de encontrar el servidor en esta dirección IP , pide las conexiones TCP de configuración. Cuando el navegador finalizó el envío de peticiones HTTP , servidor se inicia el manejo de sus paquetes de solicitud , y luego regresar los paquetes de respuesta HTTP en tu navegador . Por último , el explorador representa cuerpos de las páginas web , y se desconecta del servidor . |
| 6 | + |
| 7 | + |
| 8 | + |
| 9 | +Figura 3.1 Procesos de usuarios que visitan una página web |
| 10 | + |
| 11 | +Un servidor web también conocido como un servidor HTTP , utiliza el protocolo HTTP para comunicarse con los clientes . Todos los navegadores web pueden ser vistos como clientes. |
| 12 | + |
| 13 | +Podemos dividir los principios de trabajo de Internet en los pasos siguientes : |
| 14 | + |
| 15 | +- El cliente utiliza el protocolo TCP / IP para conectarse al servidor . |
| 16 | +- El cliente envía paquetes de solicitud HTTP al servidor. |
| 17 | +- El servidor devuelve los paquetes de respuesta HTTP para el cliente , si los recursos de petición incluyen scripts dinámicos , el servidor llama al motor de scripts primero . |
| 18 | +- El cliente se desconecta del servidor, comienza renderizado HTML. |
| 19 | + |
| 20 | +Este es un sencillo flujo de trabajo de asuntos HTTP , observe que el servidor despues de un tiempo cierra las conexiones de datos que se envían a los clientes, y espera a que la próxima petición. |
| 21 | + |
| 22 | +## URL y la resolución de DNS |
| 23 | + |
| 24 | +Siempre estamos utilizando URL para acceder a páginas web , pero ¿sabes cómo funciona el URL ? |
| 25 | + |
| 26 | +El nombre completo de la dirección URL es Uniform Resource Locator , esto es para la descripción de recursos en Internet. Su forma básica como sigue . |
| 27 | +``` |
| 28 | + esquema://host[:port #]/ruta/.../[? cadena de consulta ][# ancla ] |
| 29 | + esquema: asignación de protocolo subyacente (como HTTP , HTTPS, FTP ) |
| 30 | + host: IP o nombre de dominio del servidor HTTP |
| 31 | + puerto#: puerto por defecto es 80 , y se puede omitir en este caso. |
| 32 | + Si desea utilizar otros puertos , debe especificar qué puerto . Por ejemplo , |
| 33 | + http://www.cnblogs.com:8080/ |
| 34 | + ruta: recursos de trayectoria |
| 35 | + datos: la cadena de consulta se envían al servidor |
| 36 | + ancla Ancla |
| 37 | +``` |
| 38 | +DNS es la abreviatura de Sistema de nombres de dominio , que es el sistema de nombres de servicios informáticos en red , convierte nombres de dominio a direcciones IP reales , al igual que un traductor. |
| 39 | + |
| 40 | + |
| 41 | + |
| 42 | +Figura 3.2 Principios de funcionamiento de DNS |
| 43 | + |
| 44 | +Para entender más acerca de su principio de funcionamiento , veamos en detallado el proceso de resolución de DNS de la siguiente manera. |
| 45 | + |
| 46 | +1. Después de escrito el nombre de dominio www.qq.com en el navegador , el sistema operativo comprueba si hay alguna relación de correspondencia en el archivo hosts para el nombre de dominio , si es así, termina la resolución de nombres de dominio. |
| 47 | +2. Si no hay relación de proyección en el fichero hosts , el sistema operativo comprueba si hay alguna caché en el DNS, si es así, terminó la resolución de nombres de dominio. |
| 48 | +3. Si no hay relación de proyección de los anfitriones y la caché de DNS , el sistema operativo busca el primer servidor de resolución de DNS en la configuración de TCP / IP, que es el servidor DNS local en este momento. Cuando el servidor DNS local recibió consulta, si el nombre de dominio que desea consultar está contenida en la configuración local de los recursos regionales , a continuación, devuelve los resultados al cliente . Esta resolución DNS es autoritativo . |
| 49 | +4. Si el servidor DNS local no contiene el nombre de dominio , y hay una relación de correspondencia en la memoria caché , el servidor DNS local devuelve este resultado a cliente. Esta resolución DNS no está autorizado. |
| 50 | +5. Si el servidor DNS local no puede resolver el nombre de dominio , ya sea por la configuración de los recursos regionales o caché , que se mete en el próximo paso depende de la configuración del servidor DNS local. Si el servidor DNS local no permite el modo de avance , envía la solicitud a la raíz del servidor DNS, a continuación, devuelve la dirección IP del servidor DNS de nivel superior para saber el nombre de dominio , .com en este caso. Si el primer servidor DNS de nivel superior no sabe , envía la solicitud al siguiente servidor DNS de primer nivel hasta el que sabe el nombre de dominio . A continuación, el servidor DNS de nivel superior le pregunta al siguiente servidor DNS de nivel para qq.com , luego encuentra el www.qq.com en algunos servidores. |
| 51 | +- Si el servidor DNS local habilita seguir adelante, envía la solicitud al servidor DNS de nivel superior , si el servidor DNS de nivel superior también no sabe el nombre de dominio , a continuación, seguira enviando solicitudes a nivel superior. |
| 52 | +- Si el servidor DNS local permite a modo de avance , la dirección IP del servidor de nombre de dominio devuelve al servidor DNS local , y el servidor local envía a los clientes. |
| 53 | + |
| 54 | +Sea que el cliente DNS local habilite o no el redireccionamiento, la dirección IP del dominio siempre se retornará al serviror local de DNS, y el servidor local DNS se lo enviará de vuelta al cliente |
| 55 | + |
| 56 | + |
| 57 | + |
| 58 | +Figura 3.3 DNS flujo de trabajo de resolución. |
| 59 | + |
| 60 | +`Proceso de consulta recursiva significa que las solicitudes de información están cambiando en el proceso, encambio las solicitudes de información no cambian en el proceso de consulta iterativa .` |
| 61 | + |
| 62 | +Ahora sabemos que los clientes obtendran direcciones IP , al final, por lo que los navegadores estan comunicandose con los servidores a través de las direcciones IP. |
| 63 | + |
| 64 | +## Protocolo HTTP |
| 65 | + |
| 66 | +Protocolo HTTP es la parte fundamental de los servicios web. Es importante saber lo que es el protocolo HTTP antes de entender cómo funciona la web. |
| 67 | + |
| 68 | +HTTP es el protocolo que se utiliza para la comunicación entre navegadores y servidores web , se basa en el protocolo TCP , y por lo general utilizan el puerto 80 en el servidor web. Es un protocolo que utiliza el modelo de petición-respuesta , los clientes envían peticiones y respuestas a los servidores. De acuerdo con el protocolo HTTP , los clientes siempre cnfiguran una nueva conexión y envian una petición HTTP al servidor en cada asunto . Si el servidor no es capaz de conectar con el cliente de forma proactiva , a una llamada de conexión. La conexión entre el cliente y el servidor puede ser cerrada por cualquier lado . Por ejemplo , usted puede cancelar su tarea de descarga y conexión HTTP. Se desconecta del servidor antes de que termine la descarga. |
| 69 | + |
| 70 | +El protocolo HTTP no tiene estado, lo que significa que el servidor no tiene idea acerca de la relación entre dos conexiones , a pesar de que son ambos de un mismo cliente . Para solucionar este problema, las aplicaciones web usan Cookies para mantener el estado sostenible de conexiones. |
| 71 | + |
| 72 | +Por esta causa, debido a que el protocolo HTTP se basa en el protocolo TCP , todos los ataques TCP afectarán a la comunicación HTTP en el servidor , como por ejemplo SYN Flood, DoS y DDoS . |
| 73 | + |
| 74 | +### Paquete de solicitud HTTP (información del navegador). |
| 75 | + |
| 76 | +Solicitar paquetes tienen tres partes: la línea de petición , solicitud de encabezado y cuerpo . Hay una línea en blanco entre la cabecera y el cuerpo. |
| 77 | +``` |
| 78 | + GET/domains/ejemplo/HTTP/1.1 // línea de solicitud : método de la petición , la dirección URL , el protocolo y su versión. |
| 79 | + Host: www.iana.org / / nombre de dominio |
| 80 | + User-Agent : Mozilla/5.0 (Windows NT 6.1 ) AppleWebKit/537.4 ( KHTML , like Gecko ) información Chrome/22.0.1229.94 Safari/537.4 / / navegador |
| 81 | + Accept: text/html,application/xhtml+xml,application/xml;q=0,9,*/*;q=0.8 // mina que los clientes pueden aceptar |
| 82 | + Accept- Encoding : gzip , desinfla , compresión SDCH / / arroyo |
| 83 | + Accept- Charset : UTF- 8 , * ; q = 0.5 / / conjunto de caracteres en el lado del cliente |
| 84 | + // Línea en blanco |
| 85 | + // Cuerpo , los argumentos de recursos solicitud (por ejemplo , los argumentos de la POST ) |
| 86 | +``` |
| 87 | +Utilizamos fiddler que obtener la siguiente información de la solicitud. |
| 88 | + |
| 89 | + |
| 90 | + |
| 91 | +Figura 3.4 Información de método GET capturado por fiddler |
| 92 | + |
| 93 | + |
| 94 | + |
| 95 | +Figura 3.5 Información de método POST capturado por fiddler |
| 96 | + |
| 97 | +**Podemos ver que el método GET no tiene cuerpo de la solicitud que el POST hace.** |
| 98 | + |
| 99 | +Hay muchos métodos que puede utilizar para comunicarse con los servidores de HTTP ; GET, POST , PUT , DELETE son los 4 métodos básicos que utilizamos. Una URL representa un recurso en la red, por lo que estos 4 métodos significan consultar, cambiar , agregar y eliminar operaciones. GET y POST son los más utilizados en HTTP. GET anexa a la dirección URL y los usos ? para romper ellos , usos y entre los argumentos , como EditPosts.aspx ? name = test1 & id = 123456. POST pone los datos en el cuerpo de la petición , porque el URL tiene limitación de longitud por los navegadores , por lo que POST puede presentar muchos más datos que obtenga el método. También, cuando pasamos nuestro nombre de usuario y contraseña , no queremos que este tipo de información aparesca en la URL , por lo que utilizamos la POST para mantenerlos invisibles. |
| 100 | + |
| 101 | +### Paquete de respuesta HTTP (información del servidor) |
| 102 | + |
| 103 | +Vamos a ver qué tipo de información se incluye en los paquetes de respuesta. |
| 104 | +``` |
| 105 | + HTTP/1.1 200 OK // estado |
| 106 | + Server : nginx/1.0.8 // web server y su versión en el equipo servidor |
| 107 | + Date:Date: Tue, 30 Oct 2012 04:14:25 GMT // tiempo respondió |
| 108 | + Content-Type : text / html // tipo de datos que responde |
| 109 | + Transfer-Encoding: chunked // significa que los datos se envían en fragmentos |
| 110 | + Conexión : keep-alive // mantener la conexión |
| 111 | + Content-Length: 90 // longitud del cuerpo |
| 112 | + // Línea en blanco |
| 113 | + <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"... // cuerpo del mensaje |
| 114 | +``` |
| 115 | +La primera línea se llama línea de estado , que tiene la versión de HTTP, el código de estado y el mensaje de estado. |
| 116 | + |
| 117 | +El código de estado indica al cliente que es el servidor HTTP esta a la expectativa. En HTTP/1.1 , definimos 5 tipos de código de estado. |
| 118 | + |
| 119 | + - 1xx Informational |
| 120 | + - 2xx Success |
| 121 | + - 3xx Redirection |
| 122 | + - 4xx Client Error |
| 123 | + - 5xx Server Error |
| 124 | + |
| 125 | +Vamos a ver más ejemplos sobre los paquetes de respuesta, 200 significa servidor respondió correctamente, 302 significa la redirección . |
| 126 | + |
| 127 | + |
| 128 | + |
| 129 | +Figura 3.6 La información completa al visitar un sitio web |
| 130 | + |
| 131 | +### HTTP no tiene estado y la conexion: keep-alive |
| 132 | + |
| 133 | +Sin Estado no significa que el servidor no tiene la capacidad para mantener una conexión, en otras palabras, el servidor no distingue una relación entre dos peticiones . |
| 134 | + |
| 135 | +En HTTP/1.1 , Keep-alive se utiliza como valor predeterminado , si los clientes tienen más solicitudes , van a utilizar la misma conexión para muchas peticiones diferentes . |
| 136 | + |
| 137 | +Observe que Keep Alive no puede mantener una conexión siempre, el software que se ejecuta en el servidor tiene cierto tiempo para mantener la conexión , y usted puede cambiarlo. |
| 138 | + |
| 139 | +## Solicitar instancia |
| 140 | + |
| 141 | + |
| 142 | + |
| 143 | +Figura 3.7 Todos los paquetes para abrir una página Web |
| 144 | + |
| 145 | +Podemos ver todo el proceso de comunicación entre el cliente y el servidor de imagen superior . Usted puede notar que hay muchos archivos de recursos en la lista , se les llama archivos estáticos, y Go ha especializado métodos de procesamiento de estos archivos . |
| 146 | + |
| 147 | +Esta es la función más importante de los navegadores , solicitud de una URL y obtener datos de los servidores web , y luego representar HTML para una buena interfaz de usuario. Si encuentra algún archivo en el DOM , como archivos CSS o JS , los navegadores solicitarán estos recursos desde el servidor nuevamente, hasta que todos los recursos terminen apareciendo en la pantalla. |
| 148 | + |
| 149 | +Reducir los tiempos de solicitud HTTP es uno de los métodos que mejora la velocidad de carga de páginas web , que está reduciendo archivos CSS y JS , se reduce la presión en los servidores web a la vez . |
| 150 | + |
| 151 | +## Enlaces |
| 152 | + |
| 153 | +- [Indice](preface.md) |
| 154 | +- Sección anterior: [Conocimientos básicos sobre la Web](03.0.md) |
| 155 | +- Siguiente sección: [Armando un servidor web sencillo](03.2.md) |
0 commit comments