Unos pequeños apuntes. No aparecen todos los autores enlazados, supongo que porque tendrías que cotejarlo con el archivo de autores actualizado. Es que me parece raro que salgan algunos y otros no.
Supongo que será cosa del fichero autores_USA que tengo. Si miro en ese fichero, las líneas correspondientes a Bendis y Colan están respectivamente:
Brian Michael Bendis
<A HREF="http://www.universomarvel.com/fichas/autores/colangene.html">Gene Colan</A>
Entiendo que esto quiere decir que tengo una versión del fichero de autores de antes de que se creara la ficha de Bendis, pero de después de que se creara la de Colan, ¿no?
Exacto. Lo cual es extraño, porque tienes que tener una versión muy antigua del fichero. La actualizamos casi a diario, como bien sabes, pero lo importante es tener una versión al menos más próxima a la que tienes. Te la paso ahora por email.
Ya un poco como aspecto de interés, faltaría el editor, que no sé si es que no parece en las webs que estás utilizando.
En la web de UHBMCC no se acredita el editor de los primeros números de los 4F. Sólo empieza a acreditarse cuando entró Roy Thomas en el número 126 (y a partir de ahí unas docenas de número, y al final del volumen vuelven a desaparecer). Supongo que será porque en los cómics iniciales no estaba acreditado el editor, pero no sé la causa de que no aparezca al final.
Es raro, pero mirando más fichas, me suponía que era algo así.
Lo que me parece es que los txts no están exactamente igual que el esqueleto de prueba, como si se hubiesen cambiado el orden de algunos campos, pero no estoy seguro del todo. Además, en mi opinión, yo generaría solo los txt sin enlazar. Sería lo más práctico.
He intentado seguir el modelo, y ahora acabo de revisarlo y las veo equivalentes, pero puede que me haya despistado en algo que ahora se me esté pasando, ¿has visto algo en concreto en lo que me pueda fijar?
En datos generales, por ejemplo, se ha colado ISBN, creo que es lo único.
Respecto a lo que dices de generar sólo los txt sin enlazar, ¿por qué lo comentas? A mí lo que me suele dar bastante rabia es que al ver una ficha española y pinchar sobre el enlace a su ficha USA y me salga un error 404. Entiendo que para evitar este error, se necesitan los HTMLs y estas a su vez se obtienen de las fichas enlazadas?
Sí claro. Me explico mejor. Tú, con el programa generas fichas en html, que se publicarían para evitar esos enlaces sin dirección, o disminuirlos al mínimo. Los txt se generan para que en un futuro si alguien quiere completar esa ficha y verificar los datos que se han generado automáticamente, pueda trabajar con ellos y no sea siempre un trabajo de añadidos sobre los html para la misma persona. Entonces, sobre esos txts lo mejor es que no estén enlazados, sino en la fase previa. El motivo es muy sencillo, porque a día de hoy pueden faltar enlaces a autores de los que se hagan las fichas posteriormente. Por lo tanto, cuando se pasa el BUNSEN por el txt, ya se encarga de enlazarlo antes de general el nuevo html. Yo estoy intentando vaciar una carpeta de txt que hay en Dropbox, y me encuentro con un montón de autores entre los símbolos <I></I> y hay que ir cambiándolos por []. Creo que esto se puede evitar perfectamente, para no hacer un trabajo en balde, ya que para generar ese html, el programa siempre enlaza por defecto todo lo que esté entre los corchetes, y no se puede generar ese html sin pasar el txt por el programa. Por lo tanto, generar txt enlazados no me parece práctico.
Por cierto, para el tema de portadas, principalmente de cómics de la última década, está web es de mucha utilidad.
https://comicbookrealm.com/
Me la anoto, la conocía, pero no es de las webs que suelo tener como referencia para consultar nada.
Además, las portadas están, generalmente, a 700 píxeles de altura, que es el tamaño que nosotros utilizamos. Yo siempre las verifico por si acaso, pero parece que coincidimos en tamaño estándar.