Sep 16

La leche con el spam

Tengo desde hace tiempo un pequeño blog en el que contaba mis andanzas con los deportes: correr y bicicleta. Hoy se me ha ocurrido mirar las estadísticas de uso de recursos en el hosting donde está alojado y me encuentro con burradas como que de los 4 Gigas de disco duro que tengo disponibles hay 2 Gigas ocupados y que en transferencia de datos, en lo que va de mes, llevo gastados 14 Gigas. ¡¡ Imposible !!. Ese blog lo miramos mi amiguete de bicicleteo y yo. Así que me pongo a investigar.

Lo primero que me llama la atención es que los 2 Gigas de disco los consume la base de datos, pero que el crecimiento en el tiempo ha sido casi contínuo y exagerado, y eso que llevo casi dos años sin escribir en ese blog

crecimiento de ocupacion en disco de base de datos

Y mirando más, lo segundo que me llama la atención es el país de procedencia de la mayoría de las visitas … ¡¡CHINA!!

 

 

Así que rápidamente se me abren los ojos. Es cosa del spam seguro, llevo tiempo peleándome en mis web con spam procedente de china. En este blog en concreto, recibía montones de comentarios de spam, así que primero puse que habría que registrase para poder comentar. Seguían llegando comentarios, así que puse que los comentarios requerían aprobación …. y me olvidé de aprobarlos y controlarlos. Seguro que esos comentarios en espera de aprobación son los que ocupan base de datos.

Y efectivamente, reviso la tabla de comentarios y nada más y nada menos que 500000 registros, 500K comentarios en espera de aprobación. Así que nada, borrados todos los usuarios excepto yo, borrados todos los comentarios excepto los aprobados y a ver qué pasa. Veo en el log del sitio que hay un "chino" que está intentando acceder (login) aproximadamente una vez por minuto.

Pues eso. ¡¡Malditos spammers!!

Jun 10

Nuevo hosting y dominio con dinahosting.

Allá por Noviembre del año pasado comentaba que había superado el límite de tráfico (20 Gigas de transferencia mensual) de mi sitio web. Como comentaba, me apresuré, quizás demasiado, a ampliar el plan de hosting al siguiente, con un límite de 30 Gigas.

Pues bien, este mes pasado de Mayo mi tráfico mensual ha superado los 28 Gigas y las estadísticas de google analytics dicen que la cosa sigue subiendo. De todas formas, en Julio y Agosto suele caer mucho, ya que imagino que la mayoría de las visitas son estudiantes y programadores recién salidos incorporados al trabajo.

visitas mayo 2010

Así que de nuevo me apresuré. En su momento blaxter me aconsejó dinahosting, pues allí me he ido a mirar. Por algo menos de lo que estoy pagando ahora, me dan 90 gigas de transferencia mensual y, por supuesto, más disco, bases de datos, correos, subdominios, etc. Buscando opiniones veo que en general son buenas y es considerado un hosting serio. Nuevamente me apresuré a no pensar y contratar un plan de hosting con ellos. Y ya puestos, un dominio nuevo: chuidiang.org.

Rápidamente migré la chuwiki (que se lleva cerca de un tercio del tráfico) al nuevo dominio y un par de drupales que tenía para jugar, pero ya me está dando pereza migrar el resto, así que seguro que me voy a tirar pagando dos hosting unos cuantos meses. Y encima con el verano al llegar.

Aprovecho aquí para comentar también mi escasa experiencia (un par de días) con dinahosting. En cuestión técnica todo muy bien, incluso me ha asombrado algún detalle. Los "peros" son todos más cosas de gustos propios míos que problemas reales, así que no me hagáis mucho caso.

Me ha gustado la rapidez con la que se puso el tema en marcha. Me di de alta en dinahosting, puse los datos de mi banco … y en menos de cinco minutos recibo el correo de que está el dominio y el hosting en marcha. Y efectivamente, así es.

Dan acceso ssh, pero no conseguía entrar, así que mandé un correo al soporte y en media hora me contestaron. Era una chorradilla y ya puedo acceder al ssh, cosa que me encanta puesto que si estás acostumbrado a los comandos unix, te permite mucha más velocidad a la hora de andar rebuscando por los ficheros, moverlos y en general, hacerles perrerías.

En cuanto a los "peros":

No me ha hecho gracia tener que pagar el año completo de un solo golpe. Quizás hay alguna opción de pago mensual, pero no la he visto y parece que hace más daño pagar 150 € de golpe que 10 € + IVA al mes (el resto es el dominio). Tampoco me ha hecho mucha gracia tener que registrarme ANTES de contratar el hosting, pero bueno, es una tontería mínima, porque al final acabas registrado lo mismo.

Las passwords tampoco me hacen gracia. En la de acceso a mi panel de control y en las de bases de datos no permiten caracteres que no sean letras y números. Yo tengo la manía de meter caracteres "raros" (dentro de los primeros 128 caracteres ascii estándar) en la password y no me ha dejado. Sin embargo, en la de ftp y ssh sí lo permiten. Esto me ha supuesto un ligero contratiempo al migrar los drupales, que no guardan la password en claro en ningún fichero php, sino que la guardan encriptada, y no he podido poner en la base de datos la misma password que tenía antes. Me las he tenido que ingeniar para poner una nueva password en base de datos, conseguir su encriptación y reemplazarla en el php de drupal.

El panel de control tampoco me gusta demasiado, quizás por estar acostumbrado a cPanel, quizás por algunos detalles. No tiene posibilidad de navegar por los directorios/ficheros, por lo que la única forma de subir o editar ficheros es a través de ftp o ssh. A veces es útil subir un fichero concreto o editarlo ahí mismo. También es útil subir un zip y desempaquetarlo desde ahí mismo. Con dinahosting tienes que subir el zip con ftp y luego entrar con ssh para desempaquetarlo. También veo algo lenta de carga del panel de control y de las distintas aplicaciones que hay en él: sale hasta barra de progreso y todo. La creación de subdominios no es complicada, pero tampoco es trivial como lo es en cPanel.

Y en cuanto al problemilla con el acceso al ssh…. la documentación de dinahosting pone que la password es la misma que la de acceso al panel de control. Pues no, el de soporte me dijo que era la misma que para ftp y así era.

Así que nada, a llenar el nuevo sitio lo antes posible y a por los 90 Gigas.

Nov 27

Personalización de la página 404

 

La página 404 es la página de error que presenta un sitio web cuando se busca en él una página que no existe. Suele ser buena idea poner en esa página algún texto o algunos enlaces de forma que el usuario que ha terminado en ella, tenga una forma de llegar a donde pretendía llegar y, en plan webmaster egoísta, conseguir que no se vaya de nuestro sitio y siga navegando por él.

Google nos ofrece lo que llama widget 404, un trozo de código que podemos poner en nuestra página 404 y nos mostrará una caja de búsqueda de google, rellena con las palabras significativas de la URL fallida y que busca en el sitio web.

Aunque hace tiempo que la conocía, me he decidido a ponerla, y puedes ver el resultado si pinchas el enlace a http://www.chuidiang.com/esto-no-existe.html.

Nov 26

Excedido el límite de transferencia mensual

 

En su día tenía mi página web en geocities, sitio gratuito, pero con un límite de transferencia mensual pequeño (no recuerdo cuánto). Con el tiempo empecé a superar ese límite y empecé a obtener mensajes de error al visitar la página, estilo "este sitio está temporalmente suspendido porque ha superado el límite de transferencia…."

Así que me fui a un hosting de pago. Los 20 Gigas de transferencia mensual que me daban me parecía algo parecido a infinito comparado con el límite de geocities  Y así fue desde Marzo del 2006 hasta hoy …. en el que me ha vuelto a aparecer un mensaje "este sitio está temporalmente suspendido…..". Hoy he superador el límte de 20 Gigas de transferencia mensual y sólo estamos a día 26.

Ampliar el plan del hosting me sale unos dolares más caro y la otra opción es buscarse otro hosting con un precio similar y más transferencia. Pero la verdad es que en este hosting me va bien y el servicio técnico suele solucionarme los problemas e incluso contestar a las dudas. Así que me decidí, quizás un poco precipitadamente, a pedirles el siguiente plan, con 30 Gigas de transferencia mensual. Fue cuestión de menos de una  hora, desde que mandé el correo hasta que mi sitio tenía el nuevo plan y estaba otra vez en funcionamiento.

Y digo que quizás me precipité porque luego, investigando los logs de acceso, he visto que hay páginas que enlazan directamente a imágenes en mi sitio, en concreto, los de taringa a imágenes de mi página de efectos ópticos. Supongo que no es ese el único caso y espero que tampoco sea el motivo principal por el que excedo el límite de tráfico, pero la solución es sencilla. Basta configurar el servidor para que no admita enlaces directos a las fotos y, de hecho, las imágenes que faltan en el enlace de taringa son las que estaban descargadas directamente de mi página.

En fin, antes usaba un 10% del espacio de disco duro que tenía disponible en el hosting (1 Giga) y ahora tengo el doble de disco (2 Gigas), así que sólo uso un 5%. Tendré que ponerme las pilas y liarme a escribir tutoriales para amortizar el nuevo plan de hosting.

Nov 15

Efecto del crackeo del sitio

 

Como comenté hace unos días, me habían crackeado el sitio y habían metido spam. Google me sacó de los buscadores durante unos días hasta que solucioné el problema. Desde entonces vigilo el sitio y, toco madera, de momento no ha vuelto a suceder. De todas formas, ahí va el efecto en las visitas al desaparecer de google. El gráfico corresponde al foro, donde el efecto es más drástico, ya que apenas hay enlaces exteriores a post del foro y casi todas las visitas provienen de los buscadores.

efecto en las visitas al desaparecer del buscador google

May 27

Un barrapunto

 

Hace un mes largo alguien me puso en barrapunto. Las visitas subieron de golpe ese día (me enteré rápido porque hubo muchos más comentarios de lo habitual al post de turno). Ahí va el gráfico de turno, las visitas se multiplicaron por diez y luego fueron bajando poco a poco, durante dos semanas, hasta llegar a su tónica habitual.

visitas despues de barrapunto

Apr 02

Pa atrás, como los cangrejos

Parece que ha habido una google dance hace poco y han actualizado los page ranks. Mi sitio www.chuidiang.com, que tradicionalmente tenía page rank 4, tiene ahora page rank 3. Se ve que últimamente me esmero poco….

😛

 

Mar 12

Personalizando MediaWiki

 

Hace tiempo comenté que tenía un problema con la página aleatoria de la Wiki y el amigo google. Buscando una palabra en google, este me mostraba un enlace a la Chuwiki. Casualmente, este enlace, en vez de ser al artículo original, era la página aleatoria de la Chuwiki, por lo que pulsando el enlace mostrado por google, me iba a una página aleatoria y no a la buscada.

Hace un par de días volví a tropezarme con el problema. Busqué no sé qué en google, apareció un artículo de la Chuwiki, pinché el enlace y acabé en una página aleatoria. Así que me he decidido a arreglarlo. Por supuesto, para variar y por culpa mía, el cambio ha sido una pequeña odisea.

Lo primero de todo, por supuesto, ponerme a urgar en los ficheros php de MediaWiki, a ver dónde demonios está ese enlace de página aleatoria para quitarlo. Después de un par de horas de revisar el código, ir de un lado a otro, dar mil vueltas y no llegar a ningún sitio (está oculto el dichoso enlace), me decidí a hacer lo que debería haber hecho desde el principio: consultar la ayuda de la MediaWiki.

Las cajas de menú de la izquierda de la MediaWiki son bastante fáciles de modificar. Con permisos de administrador basta desde la misma web, editar la página MediaWiki:Sidebar. En esa página aparece el menú y se puede modificar a gusto. Para editar esa página, que no está fácilmente accesible, hay que poner la url directamente en el navegador:

http://www.tuwiki.com/index.php?title=MediaWiki:Sidebar&action=edit

y listo, ahí ponemos lo que queramos, incluso más cajas de menús. Tienes los detalles en Manual:Interface/Sidebar de la MediaWiki.

De todas formas y como siempre tiene que haber algo que incordie, después de hacer los cambios no veia en absoluto modificado el menú. El dichoso firefox tenía guardada la página en memoria y no me cambiaba el menú. Me dí cuenta al visitar otra página de la Chuwiki y ver que ahí si estaban cambiados los menús. Así que cada vez que hacía un cambio, no me quedaba más remedio que vaciar la caché del firefox ("herramientas"->"limpiar datos privados").

Feb 21

Twitter

 

Twitter lleva mucho tiempo en danza. Me dí de alta en su día, puse un par de frases y me olvidé del tema. No tenía ni idea de para qué puede servir el asunto.

Hace un mes aproximadamente empezó a apuntarse toda mi famlia en facebook, y aunque también me había dado de alta en su día, puesto un par de frases y olvidado, empezaron a darme la paliza para que lo retomara. Les hice caso y me puse a buscar gente. Encontré muchos compañeros de trabajo, algunos compañeros de colegio y mucha más familia que hace tiempo que no veo. Y allí nos hemos tirado un mes poniendo chorradas, diciendo qué estabamos haciendo en el momento. Desgraciadamente, yo soy un poco "geek" y mientras los demás ponían cosas como "pensando el disfraz para carnaval", o "me voy de cañas", yo ponía cosas como "mirando un ejemplo de hibernate" o "cagándome en python". Por supuesto, mi hermana me llamó al orden.

Así que he dejado de usar facebook con tanta frecuencia y he decidido ir poniendo estas cosas en Twiter, especialmente si pongo algún tutorial en la Chuwiki o en la página principal. Ahí, al menos, no lo va a ver nadie y quien sabe, quizás alguien tenga interés en esas cosas: http://twitter.com/chuidiang

En fin, que le he encontrado utilidad (aunque sea inútil) a Twitter.

Feb 03

Una pequeña estupidez estúpida

 

Ayer, urgando por youtube, me encontré un video que me hizo gracia. No es gracioso, supongo que sólo me llama la atención a mí. A alguien se le ocurrió bajarse el ejemplo de mi tutorial de rpc en linux, compilarlo y ejecutarlo, grabando todo el proceso en video y publicándolo en youtube. Por supuesto, a mí me ha faltado tiempo para añadir ese vídeo al tutorial.