用爬蟲爬資料是否違法?

用爬蟲爬取網路上的資料違法嗎?使用公開資訊要小心!天矽科技網頁設計

用爬蟲爬取網路上的資料違法嗎?使用公開資訊要小心!天矽科技網頁設計

 

目錄
使用網路上的資料
可以用網路爬蟲爬取資料嗎?
使用爬蟲可能遇到的法律問題
如何避免違法使用網路資源

 

使用爬蟲爬取網站上的公開資訊,是否犯法?關於這部分,要看公開的資訊能使用到什麼程度、使用者的使用目的、是否有重製販售…等,並不是所有在網路上的資料都可以任意下載使用!

使用網路上的資料


 在這個網路時代,有許多的資料與資訊都可以輕鬆找到,比圖書館還要便利!

 因此在建置網站內容前,會有許多的網站企劃人員,在網路上搜尋、參考各式相關的文案資訊,當然這些文字、圖片、攝影圖、聲音或影片…等資料,都是受到智慧財產權的保護的!不是所有網路上的圖片都可以隨便搜尋、下載並公開使用的,於是這些「他人資料」在使用之前,一定要先取得版權或其他權益的授權,並且確定資料可以作為「商業用途使用」才可以喔!

 另外,有些網站在建立時,會希望使用爬蟲將某些資訊自動爬回自家網站,但是這會碰上一些問題,比如說抓取資料的正確性、防火牆阻擋、資料比對…等,當然還有最重要的法律問題。

 那麼,如果是使用爬蟲自動抓取資料到自家網站,是合法的嗎?會有什麼法律上的問題?

延伸閱讀:
圖片授權很重要?放到網站上的圖片,一定要獲得版權許可!

 

可以用網路爬蟲爬取資料嗎?


 爬蟲就是「網路爬蟲(web crawler)」,它的作用是提供使用者更高效率、更自動化的瀏覽網路,並從網路上獲取更多資料的技術,比如Google的搜尋排名,就是靠爬蟲去發現新上線的網站、資訊、圖片…等,並將其檢索並建立索引。

 在各個網站中,通常會在網站的根目錄下建立一份robots.txt檔案,控制並說明該網站的網頁資訊,哪些資料可以爬取、哪些不行,而這個robots.txt檔案也就是「Robots協議」,不過該協議並非法規,不具有強制性的效力,是一份君子協議,因此搜尋引擎或爬蟲若有發生以下問題時,仍有可能衍生爭議與問題。

  • 未依robots.txt內容擷取非允許之資訊
  • 使用爬蟲導致原網站無法正常運作
  • 雖遵循robots.txt內容,但仍取得依法保護之資訊(如個人資料)
     

網路爬蟲

 那麼使用爬蟲爬取資訊到底是否合法?這就要看我們使用它來爬取什麼樣的東西,以及其用途是什麼了。比如說…

  • 爬蟲本身不被法律禁止,可以採集對大眾、所有人公開的「公開資訊」,但用途須合理,如教學使用。

  • 爬取非商業網站,像是國家政府資訊公開資訊觀測站資料…等,這種對外公開且提供公開查詢服務的網站,一般不構成侵權,基本上可以抓取。

  • 爬取商業網站,有些商業網站雖然沒有設定爬蟲哪些可以、哪些不可以爬取,但這種資料不代表可以隨意抓取,建議先取得對方授權同意才可執行。

  • 使用爬蟲影響正常業務,比如搶購、搶門票、搶車票…等,會影響原網站使用者體驗的就不行。

  • 雖透過合法途徑爬取資料,但使用方式不正確,同樣不合法,如爬取公開資訊進行販售。

  • 雖然已經取得合法授權使用,但沒有遵循告知的使用目的進行使用,比如約定上只能分析使用,但卻用來販售資訊,這種也不可以。

  • 用來爬取未公開、沒有經過許可、帶有敏感資訊(個資)的資料,無論如何都是非法的行為。

 

使用爬蟲可能遇到的法律問題


 根據「網管人|網路爬蟲排除協議初探 資料擷取仍有法可循」一文顯示,若使用爬蟲而產生爭議時,很有可能會涉及某些法律問題,如以下。

 

著作權法

 在網路上的東西,無論是文字還是圖片,都受到著作權法的保護,根據著作權法第10條本文規定著作人於著作完成時享有著作權」,因此如果沒有經過作者同意,是不可以任意使用其資料的。

 如果爬蟲沒有遵循robots.txt內容,也沒有獲得授權使用,就自行將其資料爬取至自家網站並任意使用,有可能會違反「著作權法第七章91條」以下之法律責任。

 

刑法

 接續著作權法,若爬蟲未遵循robots.txt內容、無獲得授權,並使用了超過應有的權限資料,那麼在刑法上還有可能涉及「妨害電腦使用罪」。

 依刑法第10條第六項顯示「磁紀錄者,謂以電子、磁性、光學或其他相類之方式所製成,而供電腦處理之紀錄。」若爬蟲獲得之資料與資訊,無論最終取得的是什麼形式的檔案與格式,都符合電磁紀錄的範圍。

 另外,刑法第358條也顯示了「無故輸入他人帳號密碼、破解使用電腦之保護措施或利用電腦系統之漏洞,而入侵他人之電腦或其相關設備者,處三年以下有期徒刑、拘役或科或併科三十萬元以下罰金。

 

公平交易法

 使用爬蟲獲取資訊,資訊在合法的範圍中,但若使用其資訊進行截取或加工,甚至影響原網站的正常運作,比如搶購、搶門票、搶車票…等,或是不當使用資訊來增加網站的到訪率、抄襲他人建置網站的資料、榨取他人努力之成果…等,就有可能會涉及不公平競爭之規範,如公平交易法第25條除本法另有規定者外,事業亦不得為其他足以影響交易秩序之欺罔或顯失公平之行為。

 

個人資料保護法

 網站資訊中若有涉及個人資料,像是姓名、電話、地址…等資料時,就會有個人資料保護法的問題。

 而個人資料保護法,若有發生個人資料被竊取、竄改、洩漏、毀損、滅失…等,或是未取得授權與違法蒐集及處理,甚至意圖為行為人自己或第三人不法利益、損害他人利益等,也有可能會再涉及民事、刑事與行政責任問題。

資料來源與參考:
網管人|網路爬蟲排除協議初探 資料擷取仍有法可循

 

如何避免違法使用網路資源

 

 無論是要否要使用爬蟲爬取他人資料,我們都應注意他人的著作權利,根據教育部一篇「如何適當使用網路資源學習手冊(一般民眾版)」之內容表示…

 網路著作權合理的使用會有四項標準原則:

  1. 利用的目的性與性質
    教育人員於網站上下載101的照片運用在教材中,讓學生認識台灣風景,但因照片只限於教學之用,無營利目的,就無侵權的疑慮。

  2. 著作之性質
    如憲法、法律、命令…等法律條文性質特殊,且內容有關於公共之利益,所以引用法條不會侵害著作權。

  3. 利用的「質和量」佔著作之比例
    若在網站上複製文章指更換標題,並發表在自己的網站上,就侵犯了著作權;但即使只是節錄文章中的一段文字,若該段文字為文章之精隨,也有可能侵犯著作權。

  4. 利用的結果是否會造成著作人的利益損害
    在網路上「合法下載」的歌曲只供自己欣賞,既轉載與販售,頁沒有造成著作權人的利益損害,就不構成侵害。

 

 如何避免侵權:

  • 徵求同意標出處
  • 看清楚網站標示,如「未經同意不得轉載」等宣告性文字
  • 了解公開不等於授權
  • 合法取得最好,如購買付費圖庫

資料來源:
教育部|如何適當使用網路資源學習手冊(一般民眾版)

 

share FB LINE
看天矽作品集 回上一頁
ID:@323foylw