Actualmente el motor de Google CSE busca entre muchos dominios, algunos de ellos demasiado genéricos devolviendo páginas que no contienen datos para descargar e introducen mucho ruido.
Actualmente se pueden usar filtros del propio Google como "filetype:csv", etc para buscar solamente datasets.
Otro problema es que Google no siempre indexa correctamente todas las fuentes de datos (algunas de ellas son interfaces con JS completas que no están correctamente indexadas).