Producción agrícola

Análisis de la producción agrícola de México, Jalisco y San Martin Hidalgo, 2013-2015

Tenemos múltiples archivos obtenidos de Sagarpa, para las tres entidades durante los años 2013, 2014 y 2015, con dos versiones, una simple y otra detallada que consiste en una subclasificación del cultivo.


Iniciamos cargando las bases de datos, y tabulando la base de datos del 2015 nacional.

In [103]:
%pylab inline
pylab.rcParams['figure.figsize'] = (10, 6)

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# three years, national
dn15 = pd.read_csv('2015.csv')
dn14 = pd.read_csv('2014.csv')
dn13 = pd.read_csv('2013.csv')

# 2015 detailed national
dn15d = pd.read_csv('2015d.csv')

# 2015 jalisco, both
djal15 = pd.read_csv('2015jal.csv')
djal15d = pd.read_csv('2015jald.csv')

# 2015 san martin, both
dsmh15 = pd.read_csv('2015smh.csv')
dsmh15d = pd.read_csv('2015smhd.csv')
Populating the interactive namespace from numpy and matplotlib
In [104]:
dn15.head()
Out[104]:
cultivo sembrado_ha cosechado_ha siniestrado_ha produccion_ton rendimiento_ton_ha pmr_v_ton produccion_kdp
0 Acelga 746.25 741.75 4.50 8179.85 11.03 3027.41 24763.75
1 Agapando (gruesa) 8.00 8.00 0.00 4375.00 546.88 225.86 988.15
2 Ajo 5438.25 5430.25 8.00 54723.56 10.08 13257.31 725487.27
3 Ajonjoli 100614.64 96317.51 4297.13 64911.27 0.67 15972.61 1036802.42
4 Albahaca 363.95 363.95 0.00 3234.62 8.89 14243.32 46071.74

Originalmente las bases de datos están ordenados alfabeticamente. Antes que nada veremos algunos estadísiticos de la primera base.

In [105]:
print "Número de productos:", len(dn15)
print "Número de productos con 0 hectareas sembradas:", len(dn15[dn15.sembrado_ha == 0])
print "Número de productos con 0 hectareas cosechadas:", len(dn15[dn15.cosechado_ha == 0])
print "Número de productos con 0 hectareas perdídas:", len(dn15[dn15.siniestrado_ha == 0])
Número de productos: 198
Número de productos con 0 hectareas sembradas: 0
Número de productos con 0 hectareas cosechadas: 0
Número de productos con 0 hectareas perdídas: 121

Al parecer no hay un cultivo que esté demás, y ninguno sufrió pérdidas totales en el año 2015. En seguida veremos cuales fueron los 10 productos más sembrados:

In [106]:
dn15.sort_values('sembrado_ha', ascending=False).head(10)
Out[106]:
cultivo sembrado_ha cosechado_ha siniestrado_ha produccion_ton rendimiento_ton_ha pmr_v_ton produccion_kdp
121 Maiz grano 7426412.19 7060274.67 366137.52 23273256.54 3.30 3115.96 72518448.81
169 Sorgo grano 2078496.98 2013908.64 64588.34 8394056.77 4.17 2380.72 19983869.73
86 Frijol 1773996.85 1680897.12 93099.73 1273957.14 0.76 8709.08 11094998.32
23 Avena forrajera 731013.77 726541.66 4472.11 10838129.16 14.92 421.73 4570753.40
183 Trigo grano 713032.79 706611.05 6421.74 3669813.71 5.19 3393.91 12455035.15
120 Maiz forrajero 577815.43 551498.43 26317.00 13777231.36 24.98 491.28 6768465.03
45 Cebada grano 321789.59 313634.08 8155.51 845706.95 2.70 3489.84 2951381.79
168 Sorgo forrajero verde 226601.92 223767.49 2834.43 4447355.92 19.88 494.35 2198530.86
171 Soya 211531.05 205629.05 5902.00 387366.38 1.88 5404.37 2093469.66
8 Algodon hueso 183782.64 183552.64 230.00 861530.57 4.69 8665.08 7465231.11

No hay sorpresa aqui. Calculando el porcentaje de cosecha/siembra, podemos ver cuales fueron los 5 productos más exitosos en cuanto a la cosecha y cuales fueron los peores:

In [107]:
dn15['exito'] = (dn15.cosechado_ha/dn15.sembrado_ha)*100
# menos pérdidas
dn15.sort_values(['exito', 'sembrado_ha'], ascending=False).head()
Out[107]:
cultivo sembrado_ha cosechado_ha siniestrado_ha produccion_ton rendimiento_ton_ha pmr_v_ton produccion_kdp exito
99 Haba verde 14011.04 14011.04 0.0 82157.74 5.86 4389.53 360634.22 100.0
90 Garbanzo forrajero 13942.00 13942.00 0.0 45221.26 3.24 1313.71 59407.48 100.0
161 Rye grass en verde 10817.02 10817.02 0.0 341438.69 31.56 643.63 219759.45 100.0
69 Ebo (Janamargo o Veza) 9704.50 9704.50 0.0 116683.62 12.02 811.50 94689.24 100.0
186 Triticale forrajero en verde 9698.45 9698.45 0.0 281917.50 29.07 435.58 122796.55 100.0
In [108]:
# más pérdidas (segundo ordenamiento: sembrado_ha)
dn15.sort_values(['exito', 'sembrado_ha'], ascending=True).head(10)
Out[108]:
cultivo sembrado_ha cosechado_ha siniestrado_ha produccion_ton rendimiento_ton_ha pmr_v_ton produccion_kdp exito
44 Cebada forrajera en verde 31534.05 20890.36 10643.69 375271.26 17.96 460.04 172640.65 66.246993
88 Frijol x pelon 467.54 337.54 130.00 1173.78 3.48 4468.28 5244.77 72.194892
38 Calabaza (semilla) o Chihua 43403.52 37872.02 5531.50 19586.58 0.52 28133.64 551041.78 87.255642
107 Jicama 8321.63 7295.63 1026.00 187188.19 25.66 3172.96 593941.35 87.670685
117 Mano de Leon (manojo) 19.00 17.00 2.00 57800.00 3400.00 22.00 1271.60 89.473684
192 Yuca alimenticia 1521.34 1381.34 140.00 18135.34 13.13 3651.27 66217.00 90.797586
175 Tabaco 8008.44 7311.94 696.50 15119.44 2.07 32091.59 485206.83 91.302925
131 Napa 130.99 120.00 10.99 2093.74 17.45 6626.13 13873.38 91.610047
41 Canola 1624.50 1494.50 130.00 1945.78 1.30 6176.80 12018.69 91.997538
181 Tomillo 25.50 23.50 2.00 74.60 3.17 17700.67 1320.47 92.156863

La cebada, el frijol, la calabaza y la jicama tuvieron un porcentaje de éxito menor al 90%, según los datos estos fueron los mas "riesgosos" en el 2015.

En seguida veremos cuales fueron los productos que más toneladas rindieron por hectarea. Y cuales fueron los que menos toneladas rinden.

In [109]:
dn15.sort_values(['rendimiento_ton_ha'], ascending=False).head(5)
Out[109]:
cultivo sembrado_ha cosechado_ha siniestrado_ha produccion_ton rendimiento_ton_ha pmr_v_ton produccion_kdp exito
149 Plantero de tabaco (planta) 30.7 30.7 0.0 134975275.0 4396588.76 0.20 27317.55 100.0
102 Hortensia (planta) 2.6 2.6 0.0 870584.0 334840.00 27.31 23775.65 100.0
12 Almacigo (planta) 5.8 5.8 0.0 1764414.0 304209.31 2.01 3543.68 100.0
30 Bel̩n (planta) 5.7 5.7 0.0 1465073.0 257030.35 6.83 10010.01 100.0
85 Fresa (planta) 727.5 727.5 0.0 182607000.0 251006.19 0.75 136647.10 100.0

Igual que el ánalisis pasado, las plantas producen más toneladas y aun no entiendo porque. El quinto cultivo que más toneladas produce es la planta de fresa, no sabia que eso existe.

Algo debe estár mal especificado, porque el valor promedio de una tonelada del tabaco, la hortensia y la fresa (planta) es menos de un peso.

In [110]:
print "Producción (pesos) / Producción (toneladas):", (136647.10*1000)/182607000.0, "(pesos)"
Producción (pesos) / Producción (toneladas): 0.748312496235 (pesos)

Tabaco:

Hortensia:

Planta de fresa (será la pura planta?):

Ahora analizaremos cuales fueron los productos más valiosos según el precio promedio de cada tonelada.

In [111]:
dn15.sort_values(['pmr_v_ton'], ascending=False).head(10)
Out[111]:
cultivo sembrado_ha cosechado_ha siniestrado_ha produccion_ton rendimiento_ton_ha pmr_v_ton produccion_kdp exito
61 Coliflor semilla 20.00 20.00 0.0 9.40 0.47 135509.00 1273.78 100.000000
109 Kenaf semilla 50.00 50.00 0.0 22.50 0.45 104000.00 2340.00 100.000000
34 Brocoli semilla 70.00 70.00 0.0 25.90 0.37 99060.00 2565.65 100.000000
176 Tarragon 10.00 10.00 0.0 78.75 7.88 72331.13 5696.08 100.000000
53 Chia 16721.00 16515.00 206.0 9548.14 0.58 44061.13 420701.81 98.768016
62 Comino 42.25 42.25 0.0 36.99 0.88 42798.05 1583.10 100.000000
175 Tabaco 8008.44 7311.94 696.5 15119.44 2.07 32091.59 485206.83 91.302925
38 Calabaza (semilla) o Chihua 43403.52 37872.02 5531.5 19586.58 0.52 28133.64 551041.78 87.255642
105 Jamaica 19396.23 19090.73 305.5 6947.57 0.36 28021.59 194681.96 98.424952
77 Estropajo 305.00 305.00 0.0 274.29 0.90 23245.00 6375.87 100.000000

El valor de una tonelada de semilla de coliflor, kenaf, brocoli son las más caras. Una tonelada de semilla de coliflor fue de $135,509 pesos! Esto también se debe probablemente a la reducida cantidad de siembra.

La chia fue bastante valiosa en el 2015, todo mundo ama la chia. Para tener una mejor idea, podemos listar las mas valiosas que se sembraron más de miles hectareas:

In [112]:
dn15[dn15.sembrado_ha > 1000].sort_values(['pmr_v_ton', 'sembrado_ha'], ascending=False).head(10)
Out[112]:
cultivo sembrado_ha cosechado_ha siniestrado_ha produccion_ton rendimiento_ton_ha pmr_v_ton produccion_kdp exito
53 Chia 16721.00 16515.00 206.00 9548.14 0.58 44061.13 420701.81 98.768016
175 Tabaco 8008.44 7311.94 696.50 15119.44 2.07 32091.59 485206.83 91.302925
38 Calabaza (semilla) o Chihua 43403.52 37872.02 5531.50 19586.58 0.52 28133.64 551041.78 87.255642
105 Jamaica 19396.23 19090.73 305.50 6947.57 0.36 28021.59 194681.96 98.424952
3 Ajonjoli 100614.64 96317.51 4297.13 64911.27 0.67 15972.61 1036802.42 95.729121
2 Ajo 5438.25 5430.25 8.00 54723.56 10.08 13257.31 725487.27 99.852894
98 Haba grano 26807.66 26467.16 340.50 33070.86 1.25 12738.77 421282.09 98.729841
84 Fresa 9078.05 9077.05 1.00 430403.43 47.42 12427.58 5348872.27 99.988984
59 Col de bruselas 1382.50 1380.50 2.00 25489.16 18.46 12066.93 307575.80 99.855335
15 Amaranto 5032.25 5014.25 18.00 6547.09 1.31 11505.86 75329.89 99.642307

La chia sale ganando! De los cultivos que se sembraron más de 1000 hectareas, aparece el ajo, la jamaica, la fresa y el amaranto. La calabeza parece ser bastante valiosa pero se registraron pérdidas de 5,531 hectareas, algo riesgosa.

Quizás sea más interesante visualizar cuales cultivos fueron muy valiosos y que se sembraron bastante poco, posiblemente indicando una falta de oferta, luego compararemos estos resultados con los de Jalisco y San Martin:

In [113]:
dn15[dn15.sembrado_ha < 20].sort_values('pmr_v_ton', ascending=False).head(10)
Out[113]:
cultivo sembrado_ha cosechado_ha siniestrado_ha produccion_ton rendimiento_ton_ha pmr_v_ton produccion_kdp exito
176 Tarragon 10.0 10.0 0.0 78.75 7.88 72331.13 5696.08 100.0
43 Canola semilla 1.0 1.0 0.0 3.20 3.20 21000.00 67.20 100.0
127 Menta 17.0 17.0 0.0 53.30 3.14 19280.42 1027.65 100.0
52 Chives 18.0 18.0 0.0 49.40 2.74 17228.53 851.09 100.0
73 Eneldo 3.5 3.5 0.0 4.60 1.31 14738.51 67.80 100.0
156 Rapini 10.0 10.0 0.0 100.00 10.00 14736.00 1473.60 100.0
115 Linaza 5.0 5.0 0.0 2.25 0.45 10000.00 22.50 100.0
108 Kale 5.0 5.0 0.0 70.00 14.00 9000.00 630.00 100.0
28 BangaNa 8.0 8.0 0.0 59.19 7.40 7523.79 445.33 100.0
178 Tomate rojo (Jitomate semilla) 4.0 4.0 0.0 140.00 35.00 5600.00 784.00 100.0

El tarragon, es el cultivo más valioso de los productos que se sembraron menos de 20 hectareas (deberiamos buscar en donde se sembraron esas 10 hectareas) con un valor promedio de $72,331 pesos cada tonelada. Otros cultivos notables son la semilla de canola, la menta, los chives y la semilla de jitomate (será dificil sembrar eso también?). De pura curiosidad podemos ver cuales cultivos fueron los más caros y que solo se producieron una sola hectarea en México 2015:

In [114]:
dn15[dn15.sembrado_ha < 2].sort_values('pmr_v_ton', ascending=False)
Out[114]:
cultivo sembrado_ha cosechado_ha siniestrado_ha produccion_ton rendimiento_ton_ha pmr_v_ton produccion_kdp exito
43 Canola semilla 1.00 1.00 0.0 3.20 3.2 21000.00 67.20 100.0
16 Anturios (gruesa) 0.26 0.26 0.0 221.26 851.0 1709.53 378.25 100.0
195 Zempoalxochitl (gruesa) 0.25 0.25 0.0 35.00 140.0 200.00 7.00 100.0
7 Alcatraz (gruesa) 1.00 1.00 0.0 540.00 540.0 163.75 88.42 100.0
188 Tulipan holand̩s (planta) 1.00 1.00 0.0 145000.00 145000.0 23.00 3335.00 100.0

Al parecer solo 5 productos se sembraron menos de 1 hectarea. La semilla de canola costó 21,000 pesos la tonelada y solo se producieron 3.2 toneladas. Los datos indican que los anturios (gruesa) fue la segunda más valiosa y solo se sembró 0.26 hectareas, con un valor de 1,709 pesos las tonelada.

Canola (semilla)

Anturios

Ahora un análisis rápido de la producción de Jalisco y de San Martin Hidalgo, para continuar con un análisis comparativo de posibles oportunidades por discrepancias en precios.

5 productos más producidos (hectareas), y más valiosos (pesos por tonelada) de Jalisco y San Martin:

In [135]:
djal15.sort_values('cosechado_ha', ascending=False).head(5)
Out[135]:
cultivo sembrado_ha cosechado_ha siniestrado_ha produccion_ton rendimiento_ton_ha pmr_v_ton produccion_kdp
44 Maiz grano 538870.35 522985.85 15884.5 3338766.29 6.38 3277.77 10943701.51
43 Maiz forrajero 176272.61 168557.61 7715.0 3701931.27 21.96 541.08 2003026.38
54 Sorgo grano 38138.63 36459.43 1679.2 190270.54 5.22 3172.62 603656.48
59 Trigo grano 35956.50 35951.50 5.0 182804.98 5.08 3014.21 551013.39
5 Avena forrajera 14055.40 14047.40 8.0 297374.30 21.17 516.48 153588.73
In [136]:
djal15.sort_values('pmr_v_ton', ascending=False).head(5)
Out[136]:
cultivo sembrado_ha cosechado_ha siniestrado_ha produccion_ton rendimiento_ton_ha pmr_v_ton produccion_kdp
21 Chia 11904.30 11854.30 50.0 6164.07 0.52 49183.48 303170.43
13 Calabaza (semilla) o Chihua 499.00 499.00 0.0 642.28 1.29 43237.75 27770.74
39 Jamaica 11.63 11.63 0.0 7.20 0.62 36818.75 265.10
2 Ajonjoli 2436.00 2403.00 33.0 1279.94 0.53 16000.41 20479.57
1 Ajo 20.00 20.00 0.0 240.00 12.00 14300.00 3432.00

Sin sorpresas, lo más cosechado fue el maiz, el sorgo, el trigo y la avena en Jalisco.

La chia es el número 1 en Jalisco en cuanto a valor de la tonelada, seguida por la semilla de calabaza, la jamaica y el Ajonjoli.

In [117]:
dsmh15.sort_values('cosechado_ha', ascending=False).head()
Out[117]:
cultivo sembrado_ha cosechado_ha siniestrado_ha produccion_ton rendimiento_ton_ha pmr_v_ton produccion_kdp
10 Maiz grano 15324.40 15324.40 0 147580.63 9.63 3199.95 472250.82
0 Arroz palay 808.00 808.00 0 6140.80 7.60 5000.00 30704.00
7 Garbanzo forrajero 721.00 721.00 0 1607.83 2.23 1391.72 2237.65
5 Cartamo forrajero en verde 224.00 224.00 0 3142.27 14.03 948.85 2981.54
9 Maiz forrajero 180.89 180.89 0 6105.04 33.75 515.42 3146.66
In [118]:
dsmh15.sort_values('pmr_v_ton', ascending=False).head()
Out[118]:
cultivo sembrado_ha cosechado_ha siniestrado_ha produccion_ton rendimiento_ton_ha pmr_v_ton produccion_kdp
3 Chia 16.3 16.3 0 10.27 0.63 32000.00 328.64
2 Chile verde 2.0 2.0 0 227.30 113.65 28948.70 6580.04
6 Frijol 15.4 15.4 0 17.86 1.16 12912.49 230.62
15 Tomate rojo (Jitomate) 13.7 13.7 0 1731.41 126.38 8939.90 15478.63
1 Calabacita 1.5 1.5 0 42.00 28.00 6636.56 278.74

Interesantemente el arroz es el segundo producto más producido en San Martin en el 2015, detras del obvio maiz de grano. El garbanzo y el cartamo fueron muy sembrados también. Probablemente solo un productor sembró el arroz palay porque el valor promedio de la tonelada fue exactamente $5,000 pesos.

En cuanto a valor, la chia, al igual que en todo Jalisco, es la número uno en cuanto a valor por tonelada, la tonelada se valoró en \$32,000 pesos. En segundo lugar fue el chile verde que costó casi \$29,000 pesos la tonelada pero solo sembraron 2 hectareas produciendo 227 toneladas de chile.

Antes de hacer un análisis total de las discrepancias en los valores, veremos el caso especifico del chile verde producido en San Martin Hidalgo. El precio del kilo fue en promedio \$29 pesos, bastante caro a comparación del valor de Jalisco (10 pesos el kilo) y especialmente contra el valor del total nacional (6.5 pesos el kilo):

In [119]:
# Nacional ($6.5 pesos x kilo)
dn15[dn15.cultivo == 'Chile verde']
Out[119]:
cultivo sembrado_ha cosechado_ha siniestrado_ha produccion_ton rendimiento_ton_ha pmr_v_ton produccion_kdp exito
51 Chile verde 148968.51 143465.17 5503.34 2732635.07 19.05 6549.0 17896024.06 96.305702
In [120]:
# Jalisco (~$10 pesos x kilo)
djal15[djal15.cultivo == 'Chile verde']
Out[120]:
cultivo sembrado_ha cosechado_ha siniestrado_ha produccion_ton rendimiento_ton_ha pmr_v_ton produccion_kdp
20 Chile verde 4070.97 4010.97 60.0 117601.84 29.32 9951.96 1170368.55

Esto implica múltiples preguntas sobre esta discrepancia:

  • ¿Se debe totalmente a la poca producción en San Martin? (Solo representa el 0.05% de la producción de Jalisco)
  • ¿Se vendería la producción localmente sin competencia?
  • ¿La tierra de San Martin es relativamente infertil o fertil para el chile?
  • ¿Fue un chile especial?

Ahora listamos los cultivos en orden de su discrepancia primero Jalisco contra Nacional y luego San Martin contra Jalisco:

In [121]:
# Jalisco vs Nacional

national = dn15.copy()
national.cultivo = national.cultivo.str.lower()
national = national.drop(['exito', 'sembrado_ha', 'siniestrado_ha', 'rendimiento_ton_ha', 'produccion_kdp'], axis=1)

jalisco = djal15.copy()
jalisco.cultivo = jalisco.cultivo.str.lower()
jalisco = jalisco.drop(['sembrado_ha', 'siniestrado_ha', 'rendimiento_ton_ha', 'produccion_kdp'], axis=1)
In [137]:
combined = pd.merge(national, jalisco, on='cultivo')
In [138]:
combined['spread'] = abs(combined['pmr_v_ton_x'] - combined['pmr_v_ton_y'])
combined = combined[(combined.pmr_v_ton_x != 0) & (combined.pmr_v_ton_y != 0)]
In [139]:
combined.sort_values('spread', ascending=False).head(10)
Out[139]:
cultivo cosechado_ha_x produccion_ton_x pmr_v_ton_x cosechado_ha_y produccion_ton_y pmr_v_ton_y spread
13 calabaza (semilla) o chihua 37872.02 19586.58 28133.64 499.00 642.28 43237.75 15104.11
39 jamaica 19090.73 6947.57 28021.59 11.63 7.20 36818.75 8797.16
37 hongos y setas 22.15 1458.39 21146.49 2.00 740.00 13200.00 7946.49
38 hortalizas 3578.27 38460.89 4577.75 2.50 14.50 12471.03 7893.28
35 garbanzo grano 106433.96 171665.46 8947.41 1109.00 1797.50 3291.47 5655.94
57 tomate rojo (jitomate) 50962.65 2875164.08 5472.91 2216.43 161804.59 11031.34 5558.43
21 chia 16515.00 9548.14 44061.13 11854.30 6164.07 49183.48 5122.35
19 chayote 2451.34 157046.83 2660.99 14.00 285.60 7600.00 4939.01
10 cacahuate 59024.37 96346.21 9464.80 576.40 974.92 13865.71 4400.91
33 frijol 1680897.12 1273957.14 8709.08 13424.54 8248.14 12267.01 3557.93
In [140]:
pylab.rcParams['figure.figsize'] = (15, 6)
combined.plot(x='cultivo', y='spread', kind='bar', grid=True, title='Diferencia en pesos $, Jalisco vs Nacional')
Out[140]:
<matplotlib.axes._subplots.AxesSubplot at 0x11884b7d0>
In [141]:
# Estadísticos de la diferencia
combined.spread.describe()
Out[141]:
count       60.000000
mean      1724.524833
std       2759.858711
min          0.050000
25%        229.070000
50%        572.180000
75%       1911.592500
max      15104.110000
Name: spread, dtype: float64
In [142]:
# Histograma de la diferencia
pylab.rcParams['figure.figsize'] = (8, 4)
combined.spread.plot(kind='hist', bins=100)
Out[142]:
<matplotlib.axes._subplots.AxesSubplot at 0x11896d850>

Evidentemente el mercado agrícola de México no es muy eficiente, ya que existen bastantes discrepancias entre los precios. La diferencia promedio de los productos comparados entre Jalisco y el total nacional es de \$1,725 pesos por tonelada. No es mucho pero lo interesante es ver los casos especiales en donde las diferencias son bastante altas por ejemplo:

  • calabaza (semilla) o chihua \$15,104.11
  • jamaica \$8,797.16
  • hongos y setas \$7,946.49
  • hortalizas \$7,893.28
  • tomate rojo \$5,558.43

Esto indica que existe la posibilidad de arbitraje, pero dado la naturaleza del activo (cultivos), trasladar y distribuir entre estados es costoso posiblemente limitando la oportunidad de arbitraje, pero, estos casos especificos podrían ser por un desequilibrio entre la oferta y la demanda ofreciendo una oportunidad de producción en ciertas areas.

Pasamos hacer el mismo análisis pero ahora comparando a San Martin con Jalisco:

In [143]:
# San Martin vs Jalisco

jalisco = djal15.copy()
jalisco.cultivo = jalisco.cultivo.str.lower()
jalisco = jalisco.drop(['sembrado_ha', 'siniestrado_ha', 'rendimiento_ton_ha', 'produccion_kdp'], axis=1)

smh = dsmh15.copy()
smh.cultivo = smh.cultivo.str.lower()
smh = smh.drop(['sembrado_ha', 'siniestrado_ha', 'rendimiento_ton_ha', 'produccion_kdp'], axis=1)
In [145]:
combined2 = pd.merge(jalisco, smh, on='cultivo')
In [146]:
combined2['spread'] = abs(combined2['pmr_v_ton_x'] - combined2['pmr_v_ton_y'])
combined2 = combined2[(combined2.pmr_v_ton_x != 0) & (combined2.pmr_v_ton_y != 0)]
In [147]:
combined2.sort_values('spread', ascending=False).head(10)
Out[147]:
cultivo cosechado_ha_x produccion_ton_x pmr_v_ton_x cosechado_ha_y produccion_ton_y pmr_v_ton_y spread
2 chile verde 4010.97 117601.84 9951.96 2.00 227.30 28948.70 18996.74
3 chia 11854.30 6164.07 49183.48 16.30 10.27 32000.00 17183.48
1 calabacita 1143.04 23262.35 3933.70 1.50 42.00 6636.56 2702.86
12 sandia 2406.00 95088.69 3102.18 30.00 736.80 5238.82 2136.64
15 tomate rojo (jitomate) 2216.43 161804.59 11031.34 13.70 1731.41 8939.90 2091.44
0 arroz palay 3735.20 19817.05 4316.56 808.00 6140.80 5000.00 683.44
6 frijol 13424.54 8248.14 12267.01 15.40 17.86 12912.49 645.48
11 melon 266.50 6236.77 5482.46 28.00 686.84 4839.46 643.00
4 cartamo 6166.33 15281.60 4405.65 78.00 162.55 3800.00 605.65
14 sorgo grano 36459.43 190270.54 3172.62 91.35 475.02 3528.57 355.95
In [148]:
pylab.rcParams['figure.figsize'] = (15, 6)
combined2.plot(x='cultivo', y='spread', kind='bar', grid=True, title='Diferencia en pesos $, SMH vs Jalisco')
Out[148]:
<matplotlib.axes._subplots.AxesSubplot at 0x119069310>

Como podemos observar también existen diferencias naturales entre los precios promedios por tonelada de San Martin y del total del estado, pero dos casos especificos resaltan:

  • Chile verde \$18,996.74
  • Chia \$17,183.48

El caso del chile verde ya lo habíamos mencionado antes, solo se sembraron 2 hectareas en San Martin y por lo tanto existe una oportunidad gracias a la poca oferta. El caso de la chia es muy similar, en el 2015 San Martin solo aportó el 0.13% de la producción de chia, y resultó ser un poco más fertil que (toneladas por hectarea) que el promedio de Jalisco. ¿Esto implica una oportunidad para producir Chia/Chile y venderla en otros municipios y o estados?


Un análisis más completo pide revisar las cuentas de cada uno de los municipios de Jalisco para poder observar/eliminar aquellos que podrían haber afectado el promedio estatal, para poder identificar si realmente existe una discrepencia sugerible y por lo tanto una oportunidad de ofertar en el mercado local y/o estatal.

In [ ]: