• macniel@feddit.de
    link
    fedilink
    Deutsch
    arrow-up
    1
    ·
    edit-2
    1 year ago

    Tjoa, also Bots schreiben, um deren Bots mit Müll zu füttern. Daraus wird dann eine neue Generation Virus und Antivirus geboren. yay.

    Respektiert der KI Crawler dann überhaupt Robots.txt?

    • Feels Good Man@feddit.de
      link
      fedilink
      Deutsch
      arrow-up
      3
      ·
      1 year ago

      Respektiert der KI Crawler dann überhaupt Robots.txt?

      Letzter Absatz im Artikel:

      An dem Absatz ist allerdings auch spannend, dass Google keine Ausnahme zu kennen scheint. Während man verhindern kann, dass Google Webseiten und Inhalte indexiert, sieht zumindest die Datenschutzerklärung das nicht für potenzielle KI-Trainingsdaten vor. Datenschutzrechtlich dürfte das schwierig sein – als würde es eine Einwilligung zu Googles Datenschutzerklärung geben, wenn man das Internet nutzt. Urheberrechtlich scheint das Vorgehen keine Schwierigkeiten zu machen. Es sind öffentlich zugängliche Daten, die zwar genutzt werden, aber nicht gespeichert.