作者 | Walker
本文是近期Github热点项目的汇总,如果你想了解更多优秀的github项目,请关注我们公众号的github系列文章。
热点 | 四月最佳Github项目库与最有趣Reddit热点讨论(文末免费送百G数据集)
开源项目对于数据科学家来说是非常的重要,他们可以通过学习源代码还可以在现有项目之上构建新的东西。于是我们主要参考github上的star挑选了2017年1月至12月间发布的30个最热门的开源机器学习库、数据集以及应用程序来供大家学习。
No1:Fasttext。Fasttext是一个能够有效地学习文本表示和句子分类的库。【11786 stars】
(https://github.com/facebookresearch/fastText)
No2:Deep-photo-styletransfer。数据和代码源自论文:“DeepPhoto Style Transfer”。【9747 stars】
(https://github.com/luanfujun/deep-photo-styletransfer)
No3:Face Recognition。该项目提供了一个简单的面部识别命令行工具,允许您对来自命令行的图像文件夹进行面部识别。【8672 stars】(https://github.com/ageitgey/face_recognition)
No4:Magenta。Magenta主要是使用强化学习算法研究机器学习在创作艺术和音乐过程中的作用的一个项目。【8113 stars】
(https://github.com/tensorflow/magenta)
No5:Sonnet。Sonnet是一个建立在Tensorflow上的用于构建复杂神经网络的一个库。【5731 stars】
(https://github.com/deepmind/sonnet)
No6:TensorFlow.js。一种用于web的硬件加速库。【5462stars】
(https://github.com/tensorflow/tfjs-core)
No7:Fast StyleTransfer in TensorFlow。你可以在几秒钟内从名画中添加样式到任何照片!【4843 stars】
(https://github.com/lengstrom/fast-style-transfer)
No8:PySC2。PySC2是星际争霸II学习环境的DeepMind的Python组件。【3686stars】(https://github.com/deepmind/pysc2)
No9:AirSim。AirSim是无人驾驶飞机、汽车的模拟器,更多的是建立在虚幻引擎上,并可以可以简单地插入到你想要的任何非真实环境中。【3861 stars】(https://github.com/Microsoft/AirSim)
No10:Facets。 Facets项目包含用于理解和分析机器学习数据集的两个可视化:Facets Overview和Facets Dive。【3371 stars】
(https://github.com/PAIR-code/facets)
No11:Style2Plants。一款图像人工合成项目。【3310stars】(https://github.com/lllyasviel/style2paints)
No12:Tensor2Tensor。T2T是一个深度学习模型和数据集的库,旨在使深度学习更容易访问并加速机器学习的研究。【3087 stars】
(https://github.com/tensorflow/tensor2tensor)
No13:CycleGAN andpix2pix in PyTorch。这个项目是PyTorch实现成对和不成对图像的翻译。【2847 stars】
(https://github.com/junyanz/pytorch-CycleGAN-and-pix2pix)
No14:Faiss。Faiss是一个高效的相似性搜索和密集向量聚类的库,它包含在任何大小的向量集合中搜索的算法。【2629 stars】
(https://github.com/facebookresearch/faiss)
No15:Fashion-MNIST。Fashion-MNIST是Zalando的文章图像数据集,包括60000个示例的训练集和10000个示例的测试集。【2780stars】(https://github.com/zalandoresearch/fashion-mnist)
No16:ParlAI。ParlAI是在多种公开的对话数据集上训练和评估人工智能模型的框架。【2578 stars】
(https://github.com/facebookresearch/ParlAI)
No17:Fairseq。Fairseq是一个研究序列化学习的工具包,从脸谱网AI研究定制为神经机器翻译(NMT)。【2571 stars】
(https://github.com/facebookresearch/fairseq)
No18:Pyro。Pyro是一个灵活的、可扩展的基于PyTorch的深度学习编程库。【2387stars】
(https://github.com/uber/pyro)
No19:iGAN。基于生成对抗网络的交互式图像生成。【2369 stars】(https://github.com/junyanz/iGAN)
No20:Deep-image-prior无监督学习神经网络的恢复。【2188 stats】(https://github.com/DmitryUlyanov/deep-image-prior)
No21:Face_classification。使用Keras CNN模型和OPen CV和OpenCV的201/IMDB数据集进行的实时人脸检测和情绪/性别分类项目。【1967 stars】(https://github.com/oarriaga/face_classification)
No22:Speech-to-Text-WaveNet。利用DeepMind的WaveNet模型实现端到端句子级英语语音识别。【1961 stars】
(https://github.com/buriburisuri/speech-to-text-wavenet)
No23:StarGAN。这个存储库提供了StarGAN的PyTorch实现。StarGAN可以仅使用单个生成器和鉴别器将输入图像灵活地翻译成任何期望的目标域。【1954 stars】(https://github.com/yunjey/StarGAN)
No24:ML-Agents。ML-Agents是一个开源的Unity插件,它使游戏和模拟能够作为智能代理训练的环境。【1658 stars】
(https://github.com/Unity-Technologies/ml-agents)
No25:DeepVideoAnalytics。深度视频分析是从视频和图像中索引和提取信息的平台。【1494 stars】
(https://github.com/AKSHAYUBHAT/DeepVideoAnalytics)
No26:OpenNMT。OpenNMT是一个利用Torch数学工具包进行全功能、开放源码(MIT)的神经机器翻译系统。【1490 stars】
(https://github.com/OpenNMT/OpenNMT)
No27:Pix2pixHD。Pix2pixHD可以用于将语义标签地图转换成照片逼真的图像,或是从脸部标签地图合成肖像。【1283 stars】
(https://github.com/NVIDIA/pix2pixHD)
No28:Horovod。Horovod是基于TensorFlow、Keras和PyTorch的分布式框架。Horovod的目标是使分布式深度学习快速且易于使用。【1188 stars】(https://github.com/uber/horovod)
No29:AI-Blocks。一个直观的WYSIWYG模型,允许任何人创建机器学习模型。【899 stars】(https://github.com/MrNothing/AI-Blocks)
No30:VoiceConversion with Non-Parallel Data。Tensorflow语音转换的深度神经网络。【845 stars】
(https://github.com/andabi/deep-voice-conversion)
【总结】:这就是小编为大家总结的过去一年github上最受欢迎的30个机器学习项目,希望大家喜欢。