2015-10-14 16 views
5

tipi di istanza: (t2.micro, t2.small, c4.large ...) quelli elencati qui: http://docs.aws.amazon.com/AWSEC2/latest/UserGuide/instance-types.htmlboto3 AWS api - Listing disponibili tipi di istanza

voglio per accedere a un elenco di questi attraverso boto3 . qualcosa come:

conn.get_all_instance_types() 

o anche

conn.describe_instance_types()['InstanceTypes'][0]['Name'] 

cui tutto sembra assomigliare in questo strano api.

Ho esaminato i documenti per client e ServiceResource, ma non riesco a trovare nulla che sembra avvicinarsi. Non ho nemmeno trovato una soluzione hacky che elenchi qualcos'altro che capita di rappresentare tutti i tipi di istanze.

Chiunque abbia più esperienza con boto3?

risposta

5

L'API EC2 non fornisce un modo per ottenere un elenco di tutti i tipi di istanza EC2. Vorrei averlo fatto. Alcune persone hanno messo insieme i propri elenchi di tipi validi raschiando siti come this ma per ora quello è l'unico modo.

+0

Avevo paura di questo. Ho già recuperato la mia lista in un file json perché ho rinunciato a trovare qualcosa dopo 2-3 ore di ricerca. – Oliver

+1

A partire da dicembre 2015 c'è un modo per ottenere queste informazioni dall'API di prezzi AWS. Vedere la mia risposta qui sotto: https://stackoverflow.com/a/47610618/211734 –

1

Prova questa

''' 
Created on Mar 22, 2017 

@author: ijessop 
''' 

import boto3 
import urllib2 
from bs4 import BeautifulSoup as soup 

class EnumEc2(): 

    def __init__(self, region): 

     self.client = boto3.client(
            'ec2', 
            aws_access_key_id = 'YOUR_KEY' , 
            aws_secret_access_key='YOUR_SECRET', 
            region_name = region 
            ) 
     self.instance_types = None 
     self.instance_table_headers = None 
     self.max_col_width = {} 


    def getInstanceTypes(self): 
     mp = soup(urllib2.urlopen('https://aws.amazon.com/ec2/instance-types').read(),'html.parser') 
     imx = mp.find(id="instance-type-matrix") 
     trs = imx.parent.parent.parent.next_sibling.next_sibling.find_all('tr') 

     rt = [] 
     first_row = True 
     for trow in trs: 
      td_strs = [] 

      for td in trow.find_all("td"): 
       td_nested = [] 
       for s in td.strings: 
        s.strip() 
        td_nested.append(s) 

       td_all = " ".join(td_nested).strip() 
       td_strs.append(td_all) 

      if first_row is True: 
       header_row = td_strs 
       for head in header_row: 
        self.max_col_width.update({head:(len(head) + 2)}) 
       first_row = False 

      else: 
       dr = dict(zip(header_row,td_strs)) 
       for k,v in dr.items(): 
        cw = len(v) 
        if k in self.max_col_width.keys(): 
         if cw >= self.max_col_width.get(k): 
          self.max_col_width.update({k:(cw +2)}) 

        else: 
         self.max_col_width.update({k:cw}) 

       rt.append(dr) 

     self.instance_table_headers = header_row 
     self.instance_types = rt 



if __name__ == '__main__': 

    myen = EnumEc2('us-west-2') 
    myen.getInstanceTypes() 
    heads_I_want_to_see = ['Instance Type', u'vCPU', u'Memory (GiB)', u'Storage (GB)','Physical Processor', u'Clock Speed (GHz)'] 
    out_str ="|" 
    for h in heads_I_want_to_see: 
     out_str = "%s%s|" % (out_str,h.ljust(myen.max_col_width.get(h))) 
    print "%s" % "-" * len(out_str) 
    print "%s" % out_str 
    print "%s" % "-" * len(out_str) 
    for i in myen.instance_types: 
     out_str ="|" 
     for k in myen.instance_table_headers: # to preserve the table column order 
      if k in heads_I_want_to_see: 
       out_str = "%s%s|" % (out_str, i.get(k).ljust(myen.max_col_width.get(k))) 
     print "%s" % out_str 
     print "%s" % "-" * len(out_str) 
0

ho bisogno di troppo, però, non ci sono codici adatti a questo scopo. Ne modifico uno da solo. Godere! Possa qualcuno averne bisogno anche

seguito il codice è stato modificato da libcloud/contrib/scrape-ec2-prices.py E questo programma genererà un dict sui tipi di istanze disponibili

#!/usr/bin/env python 

import os 
import re 
import json 
import time 
from collections import defaultdict, OrderedDict 

import requests 
import demjson 

LINUX_PRICING_URLS = [ 
    # Deprecated instances (JSON format) 
    'https://aws.amazon.com/ec2/pricing/json/linux-od.json', 
    # Previous generation instances (JavaScript file) 
    'https://a0.awsstatic.com/pricing/1/ec2/previous-generation/linux-od.min.js', 
    # New generation instances (JavaScript file) 
    'https://a0.awsstatic.com/pricing/1/ec2/linux-od.min.js' 
] 

EC2_REGIONS = [ 
    'us-east-1', 
    'us-east-2', 
    'us-west-1', 
    'us-west-2', 
    'us-gov-west-1', 
    'eu-west-1', 
    'eu-west-2', 
    'eu-central-1', 
    'ca-central-1', 
    'ap-southeast-1', 
    'ap-southeast-2', 
    'ap-northeast-1', 
    'ap-northeast-2', 
    'ap-south-1', 
    'sa-east-1', 
    'cn-north-1', 
] 

INSTANCE_SIZES = [ 
    'micro', 
    'small', 
    'medium', 
    'large', 
    'xlarge', 
    'x-large', 
    'extra-large' 
] 

RE_NUMERIC_OTHER = re.compile(r'(?:([0-9]+)|([-A-Z_a-z]+)|([^-0-9A-Z_a-z]+))') 

PRICING_FILE_PATH = './price.json' 
PRICING_FILE_PATH = os.path.abspath(PRICING_FILE_PATH) 


def scrape_ec2_pricing(): 
    result = {} 
    result['regions'] = [] 
    result['prices'] = defaultdict(OrderedDict) 
    result['models'] = defaultdict(OrderedDict) 

    for url in LINUX_PRICING_URLS: 
     response = requests.get(url) 

     if re.match('.*?\.json$', url): 
      data = response.json() 
     elif re.match('.*?\.js$', url): 
      data = response.content 
      match = re.match('^.*callback\((.*?)\);?$', data, 
          re.MULTILINE | re.DOTALL) 
      data = match.group(1) 
      # demjson supports non-strict mode and can parse unquoted objects 
      data = demjson.decode(data) 

     regions = data['config']['regions'] 

     for region_data in regions: 

      region_name = region_data['region'] 

      if region_name not in result['regions']: 
       result['regions'].append(region_name) 

      libcloud_region_name = region_name 
      instance_types = region_data['instanceTypes'] 

      for instance_type in instance_types: 
       sizes = instance_type['sizes'] 
       for size in sizes: 

        price = size['valueColumns'][0]['prices']['USD'] 
        if str(price).lower() == 'n/a': 
         # Price not available 
         continue 

        if not result['models'][libcloud_region_name].has_key(size['size']): 
         result['models'][libcloud_region_name][size['size']] = {} 
         result['models'][libcloud_region_name][size['size']]['CPU'] = int(size['vCPU']) 

         if size['ECU'] == 'variable': 
          ecu = 0 
         else: 
          ecu = float(size['ECU']) 

         result['models'][libcloud_region_name][size['size']]['ECU'] = ecu 

         result['models'][libcloud_region_name][size['size']]['memoryGiB'] = float(size['memoryGiB']) 

         result['models'][libcloud_region_name][size['size']]['storageGB'] = size['storageGB'] 

        result['prices'][libcloud_region_name][size['size']] = float(price) 

    return result 


def update_pricing_file(pricing_file_path, pricing_data): 
    ## with open(pricing_file_path, 'r') as fp: 
    #  content = fp.read() 

    data = {'compute': {}} # json.loads(content) 
    data['updated'] = int(time.time()) 
    data['compute'].update(pricing_data) 

    # Always sort the pricing info 
    data = sort_nested_dict(data) 

    content = json.dumps(data, indent=4) 
    lines = content.splitlines() 
    lines = [line.rstrip() for line in lines] 
    content = '\n'.join(lines) 

    with open(pricing_file_path, 'w') as fp: 
     fp.write(content) 


def sort_nested_dict(value): 
    """ 
    Recursively sort a nested dict. 
    """ 
    result = OrderedDict() 

    for key, value in sorted(value.items(), key=sort_key_by_numeric_other): 
     if isinstance(value, (dict, OrderedDict)): 
      result[key] = sort_nested_dict(value) 
     else: 
      result[key] = value 

    return result 


def sort_key_by_numeric_other(key_value): 
    """ 
    Split key into numeric, alpha and other part and sort accordingly. 
    """ 
    return tuple((
        int(numeric) if numeric else None, 
        INSTANCE_SIZES.index(alpha) if alpha in INSTANCE_SIZES else alpha, 
        other 
       ) for (numeric, alpha, other) in RE_NUMERIC_OTHER.findall(key_value[0])) 


def main(): 
    print('Scraping EC2 pricing data') 

    pricing_data = scrape_ec2_pricing() 
    update_pricing_file(pricing_file_path=PRICING_FILE_PATH, 
         pricing_data=pricing_data) 

    print('Pricing data updated') 


if __name__ == '__main__': 
    main() 
+0

Questo in realtà non risponde alla domanda. Se hai una domanda diversa, puoi richiederla facendo clic su [Invia domanda] (http://stackoverflow.com/questions/ask). Puoi anche [aggiungere una taglia] (http://stackoverflow.com/help/privileges/set-bounties) per attirare maggiormente l'attenzione su questa domanda una volta che hai abbastanza [reputazione] (http://stackoverflow.com/help/ che cosa è-la reputazione). - [Dalla recensione] (/ recensione/post di bassa qualità/16125989) – hivert

+0

Prima di commentare questa risposta, è necessario eseguire questo codice e vedere. Penso che sia la migliore risposta di questa domanda. –

+0

In AWS, le diverse zone disponibili hanno diversi tipi di istanze disponibili. Questo codice è stato modificato dal codice di raschiatura dei prezzi. tuttavia, questo codice può utilizzare informazioni sui prezzi (come n/a) per filtrare i tipi di istanze non disponibili in una zona disponibile. per esempio. L'istanza di f1.2xlarge può essere visualizzata solo in us-east-1 (a ~ e), e non apparirà in eu-west-1. Se si desidera elencare i tipi di istanze disponibili in eu-west-1a, f1.2xlarge non dovrebbe apparire nell'elenco dei risultati.Penso che questo codice sia l'unico codice in grado di gestire questo problema. –

1

Queste informazioni possono essere recuperate nel JSON fornite dal recentemente annunciato AWS Price List API. Come semplice esempio utilizzando il modulo Python requests:

#!/usr/bin/env python 
# List EC2 Instance Types 
# see: https://aws.amazon.com/blogs/aws/new-aws-price-list-api/ 

import requests 

offers = requests.get(
    'https://pricing.us-east-1.amazonaws.com/offers/v1.0/aws/index.json' 
) 
ec2_offer_path = offers.json()['offers']['AmazonEC2']['currentVersionUrl'] 
ec2offer = requests.get(
    'https://pricing.us-east-1.amazonaws.com%s' % ec2_offer_path 
).json() 

uniq = set() 
for sku, data in ec2offer['products'].items(): 
    if data['productFamily'] != 'Compute Instance': 
     # skip anything that's not an EC2 Instance 
     continue 
    uniq.add(data['attributes']['instanceType']) 
for itype in sorted(uniq): 
    print(itype) 

Si noti che questa operazione potrebbe richiedere un po '... a partire da oggi, l'EC2 Offerte di file JSON (https://pricing.us-east-1.amazonaws.com/offers/v1.0/aws/AmazonEC2/current/index.json) è 173MB, quindi ci vuole un po' sia per recuperare e analizzare. Il risultato corrente è 99 tipi di istanze distinte.