亿万教师注册平台sklearn的决议计划树范型能不克不及处理多类特性呢?

比如有一个特性,喜好的活动
小明喜好足球
小花喜好足球和篮球
小白喜好篮球

      喜好的活动
小明  足球
小花  篮球和足球
小白  篮球

那么这个该怎样存呢?向量还是数组?
在官网没有找到,只找到一个向量,看了一下以为又不太像,没看太懂
sklearn.feature_extraction.DictVectorizer
求大神辅导!

你这个情况是属于多标签的one-hot encoding,在sklearn里面叫MultiLabelBinarizer,同时喜好的情况把两列都置为1。

(看完/读完)这篇文章有何感想! 亿万先生注册平台的分享…

发表评论

姓名 *
电子邮件 *
站点