中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

機(jī)器學(xué)習(xí)數(shù)據(jù)集哪里找:最佳數(shù)據(jù)集來(lái)源盤(pán)點(diǎn)

2019-01-30    來(lái)源:raincent

容器云強(qiáng)勢(shì)上線!快速搭建集群,上萬(wàn)Linux鏡像隨意使用

摘要:很難找到一個(gè)特定的數(shù)據(jù)集來(lái)解決對(duì)應(yīng)的機(jī)器學(xué)習(xí)問(wèn)題,這是非常痛苦的。下面的網(wǎng)址列表不僅包含用于實(shí)驗(yàn)的大型數(shù)據(jù)集,還包含描述、使用示例等,在某些情況下還包含用于解決與該數(shù)據(jù)集相關(guān)的機(jī)器學(xué)習(xí)問(wèn)題的算法代碼。

1 -Kaggle數(shù)據(jù)集

網(wǎng)址:https://www.kaggle.com/datasets

這是我最喜歡的數(shù)據(jù)集網(wǎng)站之一。每個(gè)數(shù)據(jù)集都有對(duì)應(yīng)的一個(gè)小型社區(qū),你可以在其中討論數(shù)據(jù)、查找公共代碼或在內(nèi)核中創(chuàng)建自己的項(xiàng)目。該網(wǎng)站包含大量形狀、大小、格式各異的真實(shí)數(shù)據(jù)集。你還可以看到與每個(gè)數(shù)據(jù)集相關(guān)的“內(nèi)核”,其中許多不同的數(shù)據(jù)科學(xué)家提供了筆記來(lái)分析數(shù)據(jù)集。有時(shí)在某些特定的數(shù)據(jù)集中,你可以從筆記中找到相應(yīng)的算法,解決預(yù)測(cè)問(wèn)題。

2 -亞馬遜數(shù)據(jù)集

網(wǎng)址:https://registry.opendata.aws

該數(shù)據(jù)源包含多個(gè)不同領(lǐng)域的數(shù)據(jù)集,如:公共交通、生態(tài)資源、衛(wèi)星圖像等。它也有一個(gè)搜索框來(lái)幫助你找到你正在尋找的數(shù)據(jù)集,另外它還有數(shù)據(jù)集描述和使用示例,這是非常簡(jiǎn)單、實(shí)用的!

3- UCI機(jī)器學(xué)習(xí)庫(kù):

網(wǎng)址:https://archive.ics.uci.edu/ml/datasets.html

 

 

這是加州大學(xué)信息與計(jì)算機(jī)科學(xué)學(xué)院的一個(gè)數(shù)據(jù)庫(kù),包含了100多個(gè)數(shù)據(jù)集。它根據(jù)機(jī)器學(xué)習(xí)問(wèn)題的類型對(duì)數(shù)據(jù)集進(jìn)行分類。你可以找到單變量、多變量、分類、回歸或者是推薦系統(tǒng)的數(shù)據(jù)集。UCI的某些數(shù)據(jù)集已經(jīng)更新完畢并準(zhǔn)備使用。

4-谷歌的數(shù)據(jù)集搜索引擎:

網(wǎng)址:https://toolbox.google.com/datasetsearch

 

 

在2018年末,谷歌做了他們最擅長(zhǎng)的事情,推出了另一項(xiàng)偉大的服務(wù)。它是一個(gè)可以按名稱搜索數(shù)據(jù)集的工具箱。谷歌的目標(biāo)是統(tǒng)一成千上萬(wàn)個(gè)不同的數(shù)據(jù)集存儲(chǔ)庫(kù),使這些數(shù)據(jù)能夠被發(fā)現(xiàn)。

5 -微軟數(shù)據(jù)集:

網(wǎng)址:https://msropendata.com

2018年7月,微軟與外部研究社區(qū)共同宣布推出“微軟研究開(kāi)放數(shù)據(jù)”。

它在公共云中包含一個(gè)數(shù)據(jù)存儲(chǔ)庫(kù),用于促進(jìn)全球研究社區(qū)之間的協(xié)作。另外它還提供了一組在已發(fā)表的研究中使用的、經(jīng)過(guò)整理的數(shù)據(jù)集。

6-Awesome公共數(shù)據(jù)集:

網(wǎng)址:https://github.com/awesomedata/awesome-public-datasets

這是一個(gè)按照主題分類的,由社區(qū)公開(kāi)維護(hù)的一系列數(shù)據(jù)集清單,比如生物學(xué)、經(jīng)濟(jì)學(xué)、教育學(xué)等。這里列出的大多數(shù)數(shù)據(jù)集都是免費(fèi)的,但是在使用任何數(shù)據(jù)集之前,你應(yīng)該檢查相應(yīng)的許可要求。

7 -政府?dāng)?shù)據(jù)集:

政府的相關(guān)數(shù)據(jù)集也很容易找到。許多國(guó)家為了提高知名度,向公眾分享了各種數(shù)據(jù)集。例如:

歐盟開(kāi)放數(shù)據(jù)門(mén)戶:歐洲政府?dāng)?shù)據(jù)集。 https://data.europa.eu/euodp/data/dataset

新西蘭政府?dāng)?shù)據(jù)集。https://catalogue.data.govt.nz/dataset

印度政府?dāng)?shù)據(jù)集。https://data.gov.in/

8-計(jì)算機(jī)視覺(jué)數(shù)據(jù)集:

網(wǎng)址:https://www.visualdata.io

如果你從事圖像處理、計(jì)算機(jī)視覺(jué)或者是深度學(xué)習(xí),那么這應(yīng)該是你的實(shí)驗(yàn)獲取數(shù)據(jù)的重要來(lái)源之一。

該數(shù)據(jù)集包含一些可以用來(lái)構(gòu)建計(jì)算機(jī)視覺(jué)(CV)模型的大型數(shù)據(jù)集。你可以通過(guò)特定的CV主題查找特定的數(shù)據(jù)集,如語(yǔ)義分割、圖像標(biāo)題、圖像生成,甚至可以通過(guò)解決方案(自動(dòng)駕駛汽車數(shù)據(jù)集)查找特定的數(shù)據(jù)集。

綜上所述,從我所觀察到的情況來(lái)看,越來(lái)越多的用于研究機(jī)器學(xué)習(xí)的各種數(shù)據(jù)集變得更容易獲取,維護(hù)這些新數(shù)據(jù)集的社區(qū),也將不斷地發(fā)展,使計(jì)算機(jī)科學(xué)社區(qū)能夠繼續(xù)快速創(chuàng)新,為生活帶來(lái)更多創(chuàng)造性的解決方案。

文章原標(biāo)題《Top Sources For Machine Learning Datasets》,譯者:黃小

標(biāo)簽: Google 代碼 谷歌 數(shù)據(jù)庫(kù) 搜索 搜索引擎

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請(qǐng)與原作者聯(lián)系。

上一篇:2019 年關(guān)于數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)和人工智能的五大預(yù)測(cè)

下一篇:區(qū)塊鏈,數(shù)字社會(huì)的可信連接