Ce serait intéressant de faire une addon pour spreadsheet (et/ou intégration sur blockspring) + demandé à être ajouté en connector sur Seotoolsforexcel.
Comme l’api est super facile a utiliser, pour pouvoir l’utiliser avec spreadsheet et blockspring dans un premier temps les gens auront juste a changer l’URL a parser:
C’est pas mal l’idée de cette API. Je me demandais:
Comment prévois-tu de gérer la partie Captchas? Est-ce qu’il s’agit juste d’être capable de ne jamais les déclencher via une gestion intelligente de rotating proxies, ou est-ce que tu comptes implémenter un système de résolution multi-captchas?
Est-ce que l’API donnera la possibilité au dev de paramétrer des options du headless browser tels que le user agent, le viewport size, et autres empreintes numériques? Voir même les cookies?
Captchas: Au début on va faire en sorte d’utiliser un autre proxy dès qu’on tombe sur un capchas. A terme on mettra en place des systèmes de résolutions.
Oui c’est prévu.
On a aussi prévu de permettre l’extraction de tout ce qui est méta donnée (schema.org) ainsi que de l’info formattée pour certain type de pages (produits, articles, …) un peu dans la veine de ce que fait diffbot, mais en beaucoup moins cher.
Ca dépend du point de vue, ça peut être vu comme de l’esclavagisme moderne: ce sont des humains, des Indiens par exemple, qui passent leurs journées à résoudre des captchas. Le service étant à 3 ou 4 dollars les 1 000, moins la marge , je te laisse imaginer ce que les mecs touchent derrière…
Je travaille avec une boîte qui vend de la donnée Google SERP, à raison de plusieurs centaines de millions de requêtes/mois.
Ils ont de très lourds moyens, et pourtant ils ne cachent pas les difficultés pour ne pas se faire bloquer par Google. Tu parles de proxies dédiés à Google avec une garantie de zéro blocage de 100%?
Si c’est le cas, tu pourras te permettre de faire monter tes prix allègrement
Par ailleurs, est-ce qu’il sera possible de faker sa géo-loc afin d’avoir des requêtes géolocalisées ?
Outil intéressant. Pour les requêtes géolocalisées, on pourra de toute façon donner des urls contenant directement le paramètre uule pour géolocaliser la requête où on veut ?