De nuevo, reunión con Mario Bros.

Antes de nada me presento, me llamo Vicente Ruiz y este es mi primer post para Geneura. La verdad es que soy un acopladillo, pero es placer :)

Este Viernes hemos hablado nuevamente de Mario Bros, entrando en detalles más internos a cerca de las distintas pruebas que hay en las competiciones:

  • Game Play
  • Learning (ya nos hubiera gustado…)
  • Level Generation

Aquí dejo la presentación para descargar (yo no sé poner las presentaciones tan chulas):

Mario IA Competition

Los temas principales que se han tratado han sido las reglas de cada una de las competiciones y por dónde se puede empezar a implementar. Aunque no hemos podido hablar de Learning Track debido a que no hay ningún tipo de información disponible en la página principal ni contestan los organizadores.

Las conclusiones a las que hemos llegado es que para Game Play, el algoritmo A* funciona muy bien, pero queda mucho trabajo por hacer (mucho más de lo que yo creía) y para Level Generation puede ser una posibilidad interesante (aunque el sistema de evaluación es muy subjetivo).

Y para terminar, os dejo aquí un enlace al Agente ganador del año pasado:

Reunión con Super Mario Bros.

El pasado Viernes dedicamos la reunión al increible mundo de Super Mario Bros. :O

No, aunque lo parezca no quedamos para echar unas partidillas con el reciente (y superviciante en multijugador) New Super Mario Bros. Wii. ;) :D

En lugar de eso hicimos una charla seria, con una presentación llena de rigor acerca de dicho personaje y centrándonos únicamente en la relevancia científica de las llamadas Mario AI Competitions.

La presentación es:

En ella se comentan varios aspectos a destacar de la ‘mascota’ de Nintendo, desde sus inciertos orígenes (hay varias teorías, una de las más sólidas se puede ver en ), pasando por su relevancia dentro del mundo de los videojuegos, hasta concluir con una descripción de sus posibilidades de estudio dentro del ámbito de la ciencia (en serio). ;)  :)

De ese modo, se presentan algunas de las competiciones relacionadas con la creación de agentes autónomos que ‘jueguen’ a Super Mario y/o ‘aprendan’ a jugar, así como la generación automática de niveles en base a los gustos/criterios de un jugador específico.

Para ello se trabaja con un Framework hecho en Java (aunque se puede programar también en Phyton) que contiene el código fuente de un clon de Super Mario Bros., y que es completamente editable.

En la reunión discutimos la línea de competición por la que nos íbamos a decantar, así como posibles ideas a implementar. ;)

Desde la reunión dedicada al porno (filtrado de contenidos en navegadores :D), no se había visto otra con tanta asistencia y participación (supongo que esperarían echar una partidilla al menos). ;) :D

Taluego!

FrikiMario

Military Ants at NICSO 2010

Hi to all!
(the milliards of readers :D).

The last Wednesday (13 of May), we presented (again) our Multiobjective Ant Colony Optimization algorithm (yes, the famous CHAC :D) at NICSO 2010, which was held in Granada, in the same building where we work everyday…
… what a so far trip… :-| :D

The paper presents a study of the objective balancing parameter (named LAMBDA), used in this algorithm. ;)

Here you are the presentation:

Enjoy it! ;)

EDAs for solving Mastermind at NICSO

The NICSO 2010 talk is taking place as I type this, quite undercrowded due to flight problems, but it’s one of the places where we are presenting new work on Mastermind. In this case, we have presented the paper Adapting Heuristic Mastermind Strategies to Evolutionary Algorithms, by Tom Runarsson and myself. This paper is actually previous to the work we presented in EvoStar. In this paper is where we describe the results we found about the size of the subset of consistent combinations you have to use. OK, I lost you here, but you can watch the presentation

or download it from here. Fee license, as usual, and check the notes for the attribution of pictures.

Porn recognition

Last friday I presented the work “Simple but Effective Porn Query Recognition” by Fu et al. to the rest of the group. I chose this paper because it adress an interesting investigation line. The porn. Yeah, it is a paper with “porn” in its title, so it is necessary to print, read and explain to others.

The authors claims that it is important for a search engine to filter porn to users, to avoid bad influence in children (nevertheless, queries with war and violence, and press control it is good to grow as a good human being, it seems). In China every query is
associated to a formal ID of the user, but this is another history, and must be told in another occasion.

This paper shows a way to measure similarity between queries. For example “gay movie” is porn and “bambi movie” is not porn, although they have a term in common. Another example is “Army comrade” and “gay image”, because in Chinese the term “comrade” has different meanings. Which you can imagine.

So, the autors propose to use all documents retrieved by the query to build a term vector of each document and obtain a compose vector for the query (the paper includes nice formulae). And this is how the semantical similarity measure works.

Once the semantical comparison is stablished, the authors use a k-NN algorith to classify the queries into two classes: Porn or Not-Porn (uhm… interesting…). So,  after a conducted training the algorithm sets the class of a new query comparing with the k more simillar, using the Euclidean distance of the feature vector.

Respecting the empirical studies, the authors uses their query repository (they work in a search engine company, Roboo Inc), so they have a real data to analyze. It is interesting to note that they chose 2000 random querys to test and the ratio of porn queries is higher than non-porn ones. So, as can be seen, I think it is not a good idea to filter to their potential clients that enormous and important information.

The authors also include some charts with data and numbers and stuff, and they adress the problem that sometimes (just a little) the algorithm category a non-porn query as porn (so P=NP!!!).

To finalize this post, I have to say that is a easy to read paper and, for a profane in text recognition like me, you can learn some basis of this research line. And also, it includes funny examples. Like “pretty nurse”. Yes. In China it is a porn query.

Tía en pelotas (alemana)! (o en tetas)
This photo was taken in Dortmund, when I was in the PPSN conference. I found it quite related with the content of this post.

You can read the paper in Google Docs. Thanks to my colleague José Urquiza, that was the discoverer of the paper ;)

Pablo G.