Saltar al contenido

cómo usar el ejemplo de código tfidfvectorizer de sklearn

Haz todo lo posible por entender el código bien previamente a utilizarlo a tu proyecto si tquieres aportar algo puedes decirlo en los comentarios.

Ejemplo: ¿tf-idf ponderando una palabra de vocabulario en scikitlearn?

>>>from sklearn.feature_extraction.text import TfidfTransformer
>>>from sklearn.feature_extraction.text import CountVectorizer
>>>from sklearn.pipeline import Pipeline
>>>import numpy as np
>>> corpus =['this is the first document',...'this document is the second document',...'and this is the third one',...'is this the first document']>>> vocabulary =['this','document','first','is','second','the',...'and','one']>>> pipe = Pipeline([('count', CountVectorizer(vocabulary=vocabulary)),...('tfid', TfidfTransformer())]).fit(corpus)>>> pipe['count'].transform(corpus).toarray()
array([[1,1,1,1,0,1,0,0],[1,2,0,1,1,1,0,0],[1,0,0,1,0,1,1,1],[1,1,1,1,0,1,0,0]])>>> pipe['tfid'].idf_
array([1.,1.22314355,1.51082562,1.,1.91629073,1.,1.91629073,1.91629073])>>> pipe.transform(corpus).shape
(4,8)

Puntuaciones y comentarios

Si eres capaz, tienes la opción de dejar una sección acerca de qué le añadirías a este ensayo.

¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)



Utiliza Nuestro Buscador

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *