desde Windows
1
convertir el archivo HTML en un archivo de texto plano. Los navegadores modernos como Internet Explorer y Firefox pueden guardar archivos HTML como texto sin formato . Abra el archivo en el navegador. Pulse \\ "Guardar como \\ " o \\ " Guardar página como \\ " en el menú archivo. Seleccione \\ " Archivo de texto \\ " en \\ "Guardar como \\ tipo " cuadro de diálogo para convertir el archivo .
2
Convertir el archivo de texto a un archivo de texto Unix . En Windows , utilice un editor de texto avanzado . Abra el archivo en el editor. Busque \\ "Convertir a formato Unix \\ " (o similar) en \\ " Herramientas \\ " o \\ "Opciones \\".
3
Compruebe que el archivo se convirtió . Desde el editor de texto avanzado , seleccione \\ " Mostrar fin de línea \\ " en \\ " View. \\ " Todos los finales de línea deben ser \\ "LF . \\ "
a partir de Unix /Linux
4
Convertir el archivo HTML en un archivo de texto plano. Utilice un navegador o la utilidad de línea de comandos estándar de \\ "lynx . \\ " En un terminal, escriba \\ "lynx -dump URL > filename \\ " para convertir una página web en un archivo de texto plano.
Página 5
convertir el archivo de texto a un archivo de texto Unix utilizando el estándar \\ "tr \\ " de utilidad. Si ha utilizado un programa de Unix /Linux en el Paso 1 para convertir el archivo HTML, no será necesario este paso. En una terminal, teclee \\ "tr -d ' \\ \\ r ' < TEXT_FILE > CONVERTED_FILE . \\ "
6
Compruebe que el archivo se convirtió. Utilice el programa de \\ " gato \\ ", que también es estándar en los sistemas Unix /Linux. En una terminal, teclee \\ "cat - E archivo \\ " para ver el archivo . Todos los finales de línea deben ser el símbolo del dólar ($). ( Si ves una "M ^ \\ " carácter \\ , entonces los finales de línea están en el formato de Windows. )