mensaje="El proyecto fue exitoso"
print(mensaje)

El proyecto fue exitoso


numero=33
frase="Esta es mi edad"


print(frase,numero)

Esta es mi edad 33


type(numero)

int


type(frase)

str


otro_numero="28.2"
type(otro_numero)

print("La variable otro_numero,almacena el valor",otro_numero)

La variable otro_numero,almacena el valor 28.2


numero_decimal=30.2

print("La variable numero_decimal,tiene el valor ",numero_decimal,
      "y es de tipo",type(numero_decimal))

La variable numero_decimal,tiene el valor  30.2 y es de tipo <class 'float'>


x=10
y=2

12

8

La división de x entre y es: 5.0

La multiplicacion entre las variables x e y es: 20

Un cubo de lado 5 tiene un volumen de: 125 cm^3

El volumen de un paralelepipedo que tiene alto 2 ancho 4 y largo 7 es de:  56 cm^3

Buen dia:  juan su saldo en cuenta es de: 100

Help on function funcion_saldo in module __main__:

funcion_saldo(nombre)
    Esta es la ayuda de la funcion

Help on function funcion_saldo in module __main__:

funcion_saldo(nombre)
    Esta es la ayuda de la funcion.Esta función genera un 
    mensaje de salida con el nombre que se le entrega y el saldo que 
    por defecto se encuentra en 100

Help on function diferencia in module __main__:

diferencia(a, b, c)
    Esta funcion retorna la diferencia entre 3 valores que se le entregan

La diferencia entre a y b es 10 La diferencia entre a y c es 20 y la diferencia entre b y c es 10


x=10
y=2


print(x+2)

12


print(x-2)

8


print("La división de x entre y es:",x/y)

La división de x entre y es: 5.0


print("La multiplicacion entre las variables x e y es:",x*y)

La multiplicacion entre las variables x e y es: 20


lado=5
print("Un cubo de lado",lado,"tiene un volumen de:",lado**3,"cm^3")

Un cubo de lado 5 tiene un volumen de: 125 cm^3


alto=2
ancho=4
largo=7

print("El volumen de un paralelepipedo que tiene alto",alto,"ancho",ancho,"y largo",largo,"es de: ",alto*ancho*largo,"cm^3")

El volumen de un paralelepipedo que tiene alto 2 ancho 4 y largo 7 es de:  56 cm^3


def funcion_saldo(nombre):
    "Esta es la ayuda de la funcion"
    
    saldo=100
    return print("Buen dia: ",nombre,"su saldo en cuenta es de:",saldo)

funcion_saldo(nombre="juan")

Buen dia:  juan su saldo en cuenta es de: 100


help(funcion_saldo)

Help on function funcion_saldo in module __main__:

funcion_saldo(nombre)
    Esta es la ayuda de la funcion


def funcion_saldo(nombre):
    """Esta es la ayuda de la funcion.Esta función genera un 
    mensaje de salida con el nombre que se le entrega y el saldo que 
    por defecto se encuentra en 100"""
    
    saldo=100
    return print("Buen dia: ",nombre,"su saldo en cuenta es de:",saldo)

help(funcion_saldo)

Help on function funcion_saldo in module __main__:

funcion_saldo(nombre)
    Esta es la ayuda de la funcion.Esta función genera un 
    mensaje de salida con el nombre que se le entrega y el saldo que 
    por defecto se encuentra en 100


def diferencia(a,b,c):
    """ Esta funcion retorna la diferencia entre 3 valores que se le entregan"""
    dif1=abs(a-b)
    dif2=abs(a-c)
    dif3=abs(b-c)
    return print("La diferencia entre a y b es",dif1,"La diferencia entre a y c es",dif2,"y la diferencia entre b y c es",dif3)

help(diferencia)

diferencia(10,20,30)

Help on function diferencia in module __main__:

diferencia(a, b, c)
    Esta funcion retorna la diferencia entre 3 valores que se le entregan

La diferencia entre a y b es 10 La diferencia entre a y c es 20 y la diferencia entre b y c es 10


def multi_1(x=2):
    """Esta primera función solo multiplica por 2 la variable de entrada,por defecto el valor de entrada esta fijado en 2"""
    y=x*2
    return y

def multi_2(fn):
    """ Esta funcion toma la salida de otra funcion y la multiplica por 2"""
    z=fn*3
    return z


multi_2(multi_1(10))

60


x=True
print(x)
print(type(x))

True
<class 'bool'>


y=False

x==y

False


def cajero(tarjeta):
    """ La función permite validar si el tarjeta tiene saldo o no """
    
    saldo=100
    if tarjeta==True:
        return print("Su saldo es de",saldo)
    else: 
        return print("No se puede verificar su saldo en este momento")
              

cajero(tarjeta=True)

Su saldo es de 100


def inspector(x):
    if x==0:
        print(x,"Es cero")
    elif x>0:
        print(x,"Es positivo")
    else: 
        print(x,"Es negativo")

inspector(0)
inspector(-10)

0 Es cero
-10 Es negativo


print(bool(12))
print(bool("hola"))
print(bool(0))
print(bool(""))

True
True
False
False


primos=[2,3,5,7]

dias=["Lunes","Martes","Miercoles","Jueves","Viernes"]


cartas=[["j","q","k"],[2,3,5],[5,"A","K"]]


print(cartas[1])

print(cartas[2])

[2, 3, 5]
[5, 'A', 'K']


print(cartas[1][0])

print(cartas[2][2])

2
K


cartas[0]=["A","J","Q"]

cartas

[['A', 'J', 'Q'], [2, 3, 5], [5, 'A', 'K']]


# Cuantos dias hay en una semana
print(len(dias))

# Ordenar los dias de forma alfabetica
print(sorted(dias))

# suma de los numeros primos
print(sum(primos))

# maximo de los numeros primos
print(max(primos))

5
['Jueves', 'Lunes', 'Martes', 'Miercoles', 'Viernes']
17
7


texto="este es un texto de prueba"
texto.capitalize()

'Este es un texto de prueba'


texto.index("texto")

11


texto.split()

['este', 'es', 'un', 'texto', 'de', 'prueba']


texto.upper()

'ESTE ES UN TEXTO DE PRUEBA'


texto.lower()

'este es un texto de prueba'


t=(1,2,3)
t

(1, 2, 3)


t[0]=1

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
Cell In [87], line 1
----> 1 t[0]=1

TypeError: 'tuple' object does not support item assignment


x=0.125
numerador,denominador=x.as_integer_ratio()
print(numerador/denominador)


dias=["Lunes","Martes","Miercoles","Jueves","Viernes","Sabado"]


for i in dias:
    print(i)


numeros=[1,2,3,4,5]

for j in numeros:
    print(j)


multiplicativos=(2,2,2,3,3,5)
producto=1

for i in multiplicativos:
    producto=producto*i

producto


for i in range(5):
    print("Este i es el numero: ",i)


i=0

while i<10:
    print(i,end=" ")
    i=i+1


i=True

while i==True:
    print(i)


serie_1=[n for n in range(1,21)]
serie_1


def listas(inicio=1,termino=5):
    return [n for n in range(inicio,termino)]

l1=listas()
l1


l2=listas(inicio=10,termino=21)
l2


x="lunes es un dia"
y="Lunes es un dia"


x==y


En cambio si definimos las cadenas de texto exactamente de la misma forma.


x="Lunes es un dia"
y="Lunes es un dia"

x==y


a=print("Lunes\nes un dia")
a


a=print("Lunes\nes\nun\ndia")
a


print("Martes es otro dia de la semana")
print("Miercoles es otro dia de la semana",end='')
print("Jueves es otro dia de la semana",end='')


print("Viernes es otro dia de la semana",end='\n')
print("El sabado no se trabaja")


sabado="El sabado no se trabaja"
sabado[3]


sabado="El sabado no se trabaja"
sabado[0]+sabado[1]+sabado[2]+sabado[3:9]


len(sabado)


numeros={"uno":1,"dos":2,"tres":3}
numeros
numeros["tres"]


numeros["uno"]


numeros["cuatro"]=4
numeros


numeros["uno"]="Lunes"
numeros


Así finalmente podríamos incluso iterar un diccionario mediante un ciclo for.


for i in numeros:
    print(numeros[i])


O incluso validar si una llave se encuentra en el diccionario.


"uno" in numeros


"cinco" in numeros


numeros


dias=["lunes","martes","miercoles","jueves","viernes"]

dias_json={dia:dia[0] for dia in dias}
dias_json


dias=["lunes","martes","miercoles","jueves","viernes"]

dias_json={dia:dia[0:3] for dia in dias}
dias_json


dias_json.values()


import numpy


import numpy as np


a1=np.array([10,20,30,40])
print(a1)


De la misma forma,si quisieramos definir un array de 2 dimensiones


a2=np.array([[10,20,30,40],[50,60,70,80]])
print(a2)


a3=np.array([[[10,20,30],[40,50,60]],[[70,80,90],[110,120,130]]])
print(a3)


#Para acceder al elemento de la fila 0 columna 0 del array de 2 dimensiones
print(a2[0,0])

#Para acceder al elemento de la fila 1 columna 2 del array de 2 dimensiones
print(a2[1,2])


# Número de dimensiones para cada uno de los arrays
print(np.ndim(a1))
print(np.ndim(a2))
print(np.ndim(a3))


# Dimensiones para cada uno de los arrays
print(np.shape(a1))
print(np.shape(a2))
print(np.shape(a3))


print(a1*2)


print(2*a2/a2)


import numpy as np
b1=np.array([1,2,3])
b2=np.array([1,0,1])

#b1.dot(b2) determina el producto escalar entre los vectores b1 y b2
print(b1.dot(b2))


import numpy as np
a=np.array([[1,2,3],[4,5,6]])

print(a)
print(a.T)


import numpy as np

# El siguiente es un sistema de 2 ecuaciones lineales con 2 variables
#2x+3y=10
#4x+5y=8

a=np.array([[2,3],[4,5]])
b=np.array([10,8])
print(np.linalg.solve(a,b))


#Traemos el módulo pyplot de forma abreviada como plt
import matplotlib.pyplot as plt

#Se crea la figura y los ejes
fig,ax=plt.subplots()

#Se definen los puntos tanto del eje x como del y donde diagrama
ax.scatter(x=[1,1.5,2,2.5,3],y=[1,1.5,2,1.5,1])

#Opcionalmente podemos definir el tamaño de la figura
fig.set_size_inches(4,4)

#Finalmente mostramos el grafico
plt.show()


import matplotlib.pyplot as plt

fig,ax=plt.subplots()
ax.scatter([1,3,0.5,5,0.4,1.9,2.6],[0.9,3,5,2.5,7.6,4.3,7])

#Recordar que la definición del tamaño de la figura es opcional
fig.set_size_inches(4,4)

plt.show()


import matplotlib.pyplot as plt

fig,ax=plt.subplots()
ax.plot([1.5,2,3,4],[1,0.75,1.5,0.5])

fig.set_size_inches(4,4)

plt.show()


import matplotlib.pyplot as plt

fig,ax=plt.subplots()
ax.boxplot([2.3,4.5,1,8,10,4.5,5.6,7.6,3.4,2.4,20])

fig.set_size_inches(4,4)

plt.show()


import matplotlib.pyplot as plt

fig,ax=plt.subplots()
ax.barh([1,2,3],[3,2,1])

fig.set_size_inches(4,4)

plt.show()


import numpy as np
import matplotlib.pyplot as plt

fig,ax=plt.subplots()
x=np.random.normal(10,0.8,1000)
ax.hist(x,10)

fig.set_size_inches(4,4)

plt.show()


import plotly.express as px

#Se importa el submodulo .offline para luego usar plotly en el documento HTML
import plotly.offline as pyo
pyo.init_notebook_mode()

fig = px.scatter(x=[0, 1, 2, 3, 4], y=[0, 1, 4, 9, 16])
fig.show()


import plotly.express as px
import pandas as pd

fig= px.line(
    x = [1, 2, 3, 4],
    y = [1, 2, 3, 4]
)
fig.show()


import plotly.express as px

#Aca estamos llamando al set de datos de la tabla,que viene precargado en la librería
long_df = px.data.medals_long()

fig = px.bar(long_df, x="nation", y="count", color="medal", title="Podio de medallas por país")
fig.show()


import plotly.graph_objects as go

labels = ['Oxígeno','Hidrógeno','Dióxido de Carbono','Nitrógeno']
values = [4450, 2340, 1124, 670]

fig = go.Figure(data=[go.Pie(labels=labels, values=values)])
fig.show()


import plotly.express as px
import numpy as np

data = np.random.normal(100, 2, size=500) # replace with your own data source
fig = px.histogram(data, range_x=[90, 110])
fig.show()


import plotly.express as px
import pandas as pd

data = np.random.uniform(50,100, size=500)
fig = px.box(data,points="all")

fig.show()


import matplotlib.pyplot as plt
import numpy as np
import pandas as pd

from sklearn import datasets, linear_model
from sklearn.metrics import mean_squared_error, r2_score

# Carga del set de datos iris
iris = datasets.load_iris()
iris_df=pd.DataFrame(iris.data)

# Se asignan los nombres para cada columna del dataset
iris_df.columns=['sepal_len', 'sepal_wid', 'petal_len', 'petal_wid']

# Se selecciona la variable "sepal_len" como la variable independiente y "petal_len" como la variable dependiente
datos_x = iris_df.iloc[:,[0]]
datos_y = iris_df.iloc[:,[2]]

# Se crea una instancia de un modelo de regresión lineal
regr = linear_model.LinearRegression()


# Se ajusta el modelo de regresion lineal con las variables x e y
regr.fit(datos_x, datos_y)

y_pred = regr.predict(datos_x)

# Coefieciente del modelo: $B0 y B1$
print("Coeficientes B0 y B1: \n", regr.intercept_,regr.coef_)
# Error cuadrado medio
print("Error Cuadrado medio: %.2f" % mean_squared_error(datos_y, y_pred))
# Coeficiente de determinación del modelo lineal: 
print("Coeficiente de determinación: %.2f" % r2_score(datos_y, y_pred))

Coeficientes B0 y B1: 
 [-7.10144337] [[1.85843298]]
Error Cuadrado medio: 0.74
Coeficiente de determinación: 0.76


# Dispersion de datos y modelo lineal
plt.scatter(datos_x, datos_y, color="blue")
plt.plot(datos_x, y_pred, color="red", linewidth=3)

plt.xticks(())
plt.yticks(())

plt.show()


from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix

import warnings

# Se ignoran las advertencias
warnings.filterwarnings("ignore")

# Se carga set de datos iris
data = datasets.load_iris()
x = data.data
y = data.target

# Se crea una instancia de un modelo de regresión logística
modelo = LogisticRegression()

# Se ajusta el modelo a los datos
modelo.fit(x, y)

# Se realizan las predicciones
y_pred = modelo.predict(x)


# Calcular la precisión del modelo
accuracy = accuracy_score(y, y_pred)
print("Precisión del modelo:", accuracy)

# Mostrar la matriz de confusión
confusion = confusion_matrix(y, y_pred)
print("Matriz de confusión:")
print(confusion)

# Mostrar un informe de clasificación
report = classification_report(y, y_pred)
print("Informe de clasificación:")
print(report)

Precisión del modelo: 0.9733333333333334
Matriz de confusión:
[[50  0  0]
 [ 0 47  3]
 [ 0  1 49]]
Informe de clasificación:
              precision    recall  f1-score   support

           0       1.00      1.00      1.00        50
           1       0.98      0.94      0.96        50
           2       0.94      0.98      0.96        50

    accuracy                           0.97       150
   macro avg       0.97      0.97      0.97       150
weighted avg       0.97      0.97      0.97       150

Sintaxis	Operación	Descripción
x + y	Adición	La suma de x e y
x - y	Sustracción	La diferencia entre x e y
x * y	Multiplicación	El producto entre x e y
x / y	División	El cuociente entre x e y.
x % y	Modulo	El valor entero restante,luego de dividir x entre y.
x ** y	Potenciación	El resultado de elevar x a y.
-x	Negación	El valor negativo de x.

Operación		Descripción
x == y		x es igual y
x < y		x es menor y
x <= y		x es menor o igual que y
x != y		x no es igual a y
x > y		x es mayor que y
x >= y		x es mayor o igual que y

Método		Descripción
capitalize()		Convierte en mayuscula la primera letra del string.
index()		Busca la posición de un caracter y la devuelve.
split()		Divide un string,según el separador que se indique y lo convierte en lista.
upper()		Convierte todas las letras de un string en mayusculas.
lower()		Convierte todas las letras de un string en minusculas.

Atributo	Método	Detalle
N° de Dimensión	a.ndim()	Devuelve el número de dimensiones del array a.
Dimensiones	a.shape()	Devuelve una tupla con las dimensiones del array a.
Tamaño	a.size()	Devuelve el número de elementos del array a.
Tipo de dato	a.dtype()	Devuelve el tipo de datos de los elementos del array a.

Método	Operación	Descripción
dot(b)	Producto escalar	Determina el producto escalar entre los vectores a y b.
norm(a)	Módulo de un vector	Determina el módulo del vector v.
a.dot(b)	Producto de 2 matrices	Determina el producto matricial de las matrices a y b.
a.T	Matriz traspuesta	Determina la matriz traspuesta de la matriz a.
a.trace()	Traza de una matriz	Determina la suma diagonal principal de la matriz cuadrada a.
det(a)	Determinante de una matriz	Entrega el determinante de la matriz a.
inv(a)	Matriz Inversa	Determina la matriz inversa de la matriz cuadrada a.
eigvals(a)	Autovalores de una matriz	Determina los autovalores de la matriz cuadrada a.
eig(a)	Autovectores de una matriz	Determina los autovectores de la matriz cuadrada a.
solve(a,b)	Solución de un sistema de ecuaciones	Determina la solución de un sistema de ecuaciones lineales.

Bienvenido al curso Introducción con Python a Data Science¶

Objetivos¶

Indice¶

Hola Python 🚀¶

Funciones 🎸¶

Booleanos y condicionales 🕹¶

Funciones y condiciones¶

Listas 🏗¶

Métodos¶

Tuplas¶

Ciclos 🎰¶

Ciclo for¶

Ciclo While¶

Diccionarios 📗¶

Diccionarios¶

Trabajando con librerías 🎮¶

Librería Numpy¶

Librería Matplotlib¶

Diagramas de dispersión¶

Diagramas de líneas¶

Diagramas de cajas¶

Diagramas de barras¶

Histograma¶

Librería Plotly¶

Gráficos de líneas¶

Gráficos de barra¶

Gráficos de torta¶

Histogramas¶

Diagramas de Cajas¶

Scikit-Learn 📀¶

Regresión Lineal¶

Regresión Logistica¶

País	Medallas	Cantidad
Corea del Sur	Oro	25
China	Oro	10
Canada	Oro	9
Corea del Sur	Plata	13
China	Plata	15
Canada	Plata	12
Corea del Sur	Bronce	11
China	Bronce	8
Canada	Bronce	12