Et si on partage nos recherches avec Yacy ? - Dryusdan.fr dryusdan.fr/et-si-on-partage-n Yacy, le moteur de recherche en Peer 2 Peer pour se passer de Google. Et si on regardait un peu plus en détail cet outil ? #Yacy #SearchEngine #P2P #DHT #Autohébergement #selfHosting #autopromo link.dryusdan.fr/?4u3Ntw

@Dryusdan Dans ton article tu dis "il n'y a pas de profilage, donc pas de bulle de pensée" ce qui est assez faux, c'est même assez identique à Google en pratique.
Il n'est certes, pas direct comme Google, mais il se situent à un autre endroit : tu n'as les résultats que de ce qu ia été crawl, et comme Yacy semble se baser sur une base de connaissance lié à a conf (je veux indexer ci et ça), t'as une bulle de pensée de l'admin du Yacy

@Sp3r4z
Pas exactement car l'index est partagé entre tout les nœuds :)

@Dryusdan dans un monde idéal, en théorie. Sauf qu'en pratique c'est plus aussi "génial" :
- Combien d'instances Yacy ?
- La somme des individualités peut créer des troues
- Comment avoir conscience des autres instances ?

C'est pas aussi évident, je pense :s (le projet est cool, clairement ;) )

@Sp3r4z
500 environs, d'où le topic et peut être un appel a en créer.
Y a plein de tracker (j'ai pas trop creuser) qui référence les peer (P2P) et les index sont partagés grâce à DHT

@Dryusdan D'accord, donc c'est pas mal en terme d'infra.
Par contre, c'est dommage que jamais personne parle du fait que c'est forcément biaisé. Ça peut crawler en sauvage ? (genre sa trouve un lien vers un site, ça se met à la crawl ou pas ?)

@Sp3r4z
N'importe qui peut envoyer des sites a indexer
L'outil peut indexer des pages grâces aux flux RSS
Tu peux avoir eu crawling avec plein de profondeur.
Inconvénient tu as raisons, si personne veut indexer twitter, twitter ne sera que peu indexer.
Avantage : plus de point central

Follow

@Dryusdan Les avantages je les ai (je ne suis pas sur Mastodon pour rien ;) ), tu les explique aussi dans ton billet ;)

Mais t'as touché du doigt ce que je voulais dire (un peu maladroitement) sur le fait que si personne indexe twitter, il n'existe pas. Sans pour ça défendre Google, l'économie fait qu'il indexe quand même beaucoup (pour pas dire quasi pléthorique), la restitution est cependant bien différente…

Autre question : la pertinence des résultats (il y a un travail là dessus à faire)

@Dryusdan ↑ Pour travailler avec du SolR au taff, je sais que la pertinence est au final la colonne vertébral du truc (comme l'analyse des données en statistiques). C'est important, et ça sera à se poser.
Google on lui tape dessus, mais j'attend quand même de voir la politique te la gouvernance des résultat dans ce genre d'outil :s

@Sp3r4z
Google indexe beaucoup mais affiche pas tout
Sur le coup Yacy pareil.
Pour être franc j'ai vu plus des résultats à la qwant qu'à la Google

Après tout le monde peut être le réseau et installer yacy sur son poste / serveur

@Dryusdan Complètement, je sais bien.
C'est juste que les questions sont très intéressantes, et pas du tout évidentes en réalité. L'outil (ici Yacy) est assez peu important, on l'a vu avec Mastodon, l’outil fonctionne, mais c'est une petite partie de la solution. Ladite solution étant : la gouvernance, et ce qui es est fait :)

Sign in to participate in the conversation
Mastodon

The social network of the future: No ads, no corporate surveillance, ethical design, and decentralization! Own your data with Mastodon!