Agregatoarele de știri

Ar fi o idee să bage Google un filtru așa încât să poți să obții la căutare numai rezultate „originale”, fără duplicate pe agregatoarele automate de știri.

Anunțuri

3 gânduri despre „Agregatoarele de știri

  1. ce inseamna „originale”? numai dupa timpul de postare imi pare a fi ceva original…
    sau iei stirile numai de la agentiile de presa? chiar si asa ar tb initial parsing si language processing la greu ca sa detectezi duplicatele, chestii care iau f. mult timp si nu sunt 100% reliable. chiar si cu termeni cheie si limbaj structurat (termenii sunt aceiasi si/sau ai reguli semantice), daca atingi 80% e bine…
    nu ai mai avea „real time” deloc, ar tb. alea sa crunch-crunch toata ziua si ar crea un backlog de toata frumusetea.

  2. tocmai asta ziceam. procesul de comparare ia timp. daca nu ai tags ca „preluat de la X”, e greu, e time consuming.

    si mai e ceva: dupa mine copie este si atunci cand schimbi lucruri ne-esentiale din original. iei un paragraf, faci un rephrasing, arunci 2-3 virgule si zici ca e nou, dar de fapt nu ai schimbat nimic, nu ai adaugat nimic. tot copie este.

Lasă un răspuns

Completează mai jos detaliile tale sau dă clic pe un icon pentru a te autentifica:

Logo WordPress.com

Comentezi folosind contul tău WordPress.com. Dezautentificare / Schimbă )

Poză Twitter

Comentezi folosind contul tău Twitter. Dezautentificare / Schimbă )

Fotografie Facebook

Comentezi folosind contul tău Facebook. Dezautentificare / Schimbă )

Fotografie Google+

Comentezi folosind contul tău Google+. Dezautentificare / Schimbă )

Conectare la %s