Inicio
Buscar
Ingresar
Registrarse
Starfield: el juego que revolucionará el espacio y la tecnología
Hack x Crack - Comunidad de Seguridad informática
»
Hack x Crack
»
Dudas Generales
»
el texto leido de un archivo de una url no se codifica a utf8
Imprimir
Páginas: [
1
]
2
Ir Abajo
Autor
Tema: el texto leido de un archivo de una url no se codifica a utf8 (Leído 5137 veces)
$francisco
{ L6 } Flooder del foro
Mensajes: 781
el texto leido de un archivo de una url no se codifica a utf8
«
en:
Julio 19, 2016, 12:22:02 am »
Muy buenas, estoy usando
kodi
y lo que hago es extraer un texto de una url y este texto pasa a ser parte de código con la función
eval()
resulta que el texto contiene la palabra "español" en unicode "espa\xf1ol" pero este funciona está dentro de un archivo de texto.
http://dropbox.com/texto.txt
Código: Python
idiomas
=
{
'es'
:
'español'
}
esto esta en texto plano pero cuando lo recivo hago lo siguiente.
Código: Python
url
=
'http://dropbox.com/texto.txt'
f
=
urllib2
.
urlopen
(
url
)
.
read
(
)
.
encode
(
'utf8'
)
lo he probado de muchas maneras con
Código: Python
unicode
(
f
,
'utf8'
)
incluso con decode que no tiene mucho sentido ya que lo lee en unicode
¿se os ocurre como podría solucionar este problemas? el error que me lanza es este
UnicodeDecodeError: 'ascii' codec can't decode byte 0xf1 in position 4: ordinal not in range(128)
En línea
b10s_0v3rr1d3
Administrador
{ L6 } Flooder del foro
Mensajes: 885
why not die?
Re:el texto leido de un archivo de una url no se codifica a utf8
«
Respuesta #1 en:
Julio 19, 2016, 04:55:31 am »
y usando el default encoding?
para forzarlo a utf-8 desde el punto de llamada de dicha funcion hasta finalizar el script
En línea
$francisco
{ L6 } Flooder del foro
Mensajes: 781
Re:el texto leido de un archivo de una url no se codifica a utf8
«
Respuesta #2 en:
Julio 20, 2016, 10:04:45 pm »
como se hace eso? por ahora lo unico que me funcionó fue
Código: Python
texto.
replace
(
"
\0
xf1"
,
"ñ"
)
En línea
b10s_0v3rr1d3
Administrador
{ L6 } Flooder del foro
Mensajes: 885
why not die?
Re:el texto leido de un archivo de una url no se codifica a utf8
«
Respuesta #3 en:
Julio 21, 2016, 06:19:00 pm »
hi,
por medio del 'sys':
Código: Python
import
sys
reload
(
sys
)
sys
.
setdefaultencoding
(
'utf8'
)
En línea
$francisco
{ L6 } Flooder del foro
Mensajes: 781
Re:el texto leido de un archivo de una url no se codifica a utf8
«
Respuesta #4 en:
Julio 21, 2016, 08:43:39 pm »
Probé eso y nada, sigue sin funcionar no entiendo el motivo de el porque cuando por medio de la consola si se muestra correctamente y con KODI no lo muestra, aunque lo pase decodeado a utf8 para que después pueda codificarlo a utf8 nada y si lo paso codificado en utf8 igual me tira el mismo erro, quizás sea problema de el programa KODI que no interpreta correctamente utf8 en los plugins
En línea
b10s_0v3rr1d3
Administrador
{ L6 } Flooder del foro
Mensajes: 885
why not die?
Re:el texto leido de un archivo de una url no se codifica a utf8
«
Respuesta #5 en:
Julio 25, 2016, 04:45:12 am »
mmmmm..... no he testeado del todo ese elemento :S
(no se si ayudara, pero algo parecido a esto puede ser solucion a dicho problema?
link
)
En línea
ravenheart
{ L7 } Juanker
Mensajes: 1359
Todos mis mensajes están bajo la licencia WTFPL v2
Re:el texto leido de un archivo de una url no se codifica a utf8
«
Respuesta #6 en:
Julio 25, 2016, 08:59:49 am »
Prueba a codificar el texto en base64 antes de ponerlo en la URL y decodificarlo tras extraerlo.
Hum, leí mal, creía que el propio texto iba en la URL, y no la ruta.
¿Puedes meter el archivo en un zip y subirlo a algún sitio?
«
Última modificación: Julio 25, 2016, 11:52:11 am por ravenheart
»
En línea
You do not need hope if you have drama to back you up.
$francisco
{ L6 } Flooder del foro
Mensajes: 781
Re:el texto leido de un archivo de una url no se codifica a utf8
«
Respuesta #7 en:
Julio 25, 2016, 11:50:36 pm »
Esta es la ruta de el archivo
https://dl.dropboxusercontent.com/u/30418660/kodi_movies/idiomas.txt
aqui se encuentra el texto que transformo en código con "exec" y al parecer no imprime bien el texto que no sea ascii lo mismo me pasa que me lanza un error con "\r\n" al intentar leer el archivo y pasarlo a código tengo que reemplazar esto con "replace('\r\n','')" para que el texto me funcione en mac y en linux solo funciona en window el problema esta al pasar el texto que recojo en los archivos a código con la función "exec" pero no logro darle solución
En línea
ravenheart
{ L7 } Juanker
Mensajes: 1359
Todos mis mensajes están bajo la licencia WTFPL v2
Re:el texto leido de un archivo de una url no se codifica a utf8
«
Respuesta #8 en:
Julio 26, 2016, 08:26:34 am »
Ese archivo es ANSI, no UNICODE.
En línea
You do not need hope if you have drama to back you up.
$francisco
{ L6 } Flooder del foro
Mensajes: 781
Re:el texto leido de un archivo de una url no se codifica a utf8
«
Respuesta #9 en:
Julio 26, 2016, 02:49:32 pm »
Pero ¿no debería solucionarse con un "encode('utf8')"? ¿como podría solucionarlo?
En línea
Imprimir
Páginas: [
1
]
2
Ir Arriba
Hack x Crack - Comunidad de Seguridad informática
»
Hack x Crack
»
Dudas Generales
»
el texto leido de un archivo de una url no se codifica a utf8
Va un mudo y le dice a un sordo: Hack x Crack usa cookies. Pues eso...
OK
Learn more