基于AWS技术实现发布/订阅服务

最后更新于:2022-04-01 01:54:18

作者 Boris Lublinsky ,译者 王丽娟 AWS提供两种服务——Amazon简单通知服务(Simple Notification Service)和Amazon简单队列服务(Simple Queue Service),两者结合起来可以为完整的发布/订阅服务提供支撑。 ## 现有的AWS功能 Amazon[简单通知服务](http://aws.amazon.com/sns)(Amazon SNS)是一个Web服务,能让应用、最终用户和设备立即从云端发送和接收通知。简化的SNS架构如下图所示(图1): ![](https://docs.gechiui.com/gc-content/uploads/sites/kancloud/2015-08-01_55bc61f0980a6.jpeg) 图1:Amazon SNS的基础架构 多个发布应用和多个订阅应用可以将SNS主题作为中介互相通讯。这样实现的优点是发布者和订阅者不需要知道对方,因此,应用可以完全动态地进行集成。SNS支持用多种传输协议传递通知,包括HTTP、HTTPS、Email、SMS和Amazon简单队列(Simple Queue)。 Amazon[简单队列服务](http://aws.amazon.com/sqs)(Amazon SQS)提供可靠、可伸缩的托管队列,用来存储计算机之间传输的消息。使用Amazon SQS,你可以在执行不同任务的应用分布式组件之间移动数据,而不会丢失消息,也不必要求每个组件始终都是可用的。SQS和SNS结合起来会带来两个额外的优势——解除时间上的耦合度,根据消费应用特定的情况提供负载均衡——这是SNS无法单独提供的。要做到第二个附加优势,需要同一个应用的多个实例从同一个队列里读取消息。下图展示了SNS和SQS结合的总体架构(图2)。其中的一个订阅应用显示为负载均衡的。 ![](https://docs.gechiui.com/gc-content/uploads/sites/kancloud/2015-08-01_55bc61f0a4e9e.jpeg) 图2:结合SNS和SQS 这个实现的主要缺点是,发布者和订阅者需要明确统一SNS主题的名称。此外,如果一个特定的消费者想从多个主题获取信息,那他需要把队列注册到多个主题上。 ## 期望中的发布/订阅实现 这个问题的典型解决方案是采用基于树的主题组织,大部分发布/订阅引擎都是这样实现的。OASIS规范的[Web Services Topics 1.3](http://docs.oasis-open.org/wsn/wsn-ws_topics-1.3-spec-os.pdf)概述了这种组织的主要原则。 这个规范将主题定义为: “……主题是一组通知的组织和分类方式。主题机制为订阅者推断出感兴趣的通知提供了便捷的方式……发布者可以将通知发布和一或多个主题关联起来。当订阅者创建订阅的时候,可以提供一个主题的过滤器表达式,将订阅和一或多个主题关联起来……每个主题都可以有零或多个**子主题**,子主题本身也可以进一步包含子主题。没有‘父亲’的主题叫**根主题**。特定的根主题和它所有的后代会形成一个层次结构(称为**主题树**)。” 下面是手机销售的一个主题树例子(图3)。 ![](https://docs.gechiui.com/gc-content/uploads/sites/kancloud/2015-08-01_55bc61f0b4226.jpeg) 图3:主题树示例 主题树的根表示销售。销售可以按区域细分(在我们的例子中有北美、欧洲和亚太地区)。特定区域的销售还可以按照手机类型进一步细分,依此类推。 在发布/订阅系统中,这样的结构之所以重要是因为树反映了数据的组织。如果消费者对北美的智能手机销售感兴趣,他可以监听这个特定的主题。如果他对北美所有的销售都感兴趣,那他就可以监听北美的主题,从子主题获取所有的通知。 当然,这种方法并不能解决所有的问题。比如说,如果消费者想监听所有智能手机销售的事件,他就需要明确订阅所有地区的智能手机销售事件。这种情况通常是主题树设计的问题。树的设计基于信息的组织和典型的使用模式。在某些情况下,会设计多个主题来满足不同的内部需求(参见[Web Services Topics 1.3](http://docs.oasis-open.org/wsn/wsn-ws_topics-1.3-spec-os.pdf)里的主题命名空间)。发布/订阅架构的另一个重要特性就是[基于内容的消息过滤](http://en.wikipedia.org/wiki/Publish–subscribe_pattern): “在基于内容的系统中,如果消息的属性或内容与订阅者定义的约束相匹配,消息就只会传递给这个订阅者。订阅者负责消息的分类。” 换句话说,订阅者在这种情况下可以使用正则表达式列表,明确指定他们感兴趣的消息内容。 把这种过滤和结构化的主题结构结合起来,可以创建出非常灵活和强大的发布/订阅实现。 我们将在本文中展示如何用AWS组件轻松构建这类系统。 ## 发布/订阅架构建议 建议给大家的架构如下图所示(图4)。在这个架构中,发布/订阅服务器的实现是一个Tomcat容器里运行的Web应用。我们还充分利用了AWS的[弹性负载均衡器(Elastic Load Balancer)](http://aws.amazon.com/elasticloadbalancing),它可以根据当前的负载动态扩展或缩减发布/订阅服务器集群的大小。此外,架构还用[关系型数据服务(Relational Data Service)](http://aws.amazon.com/rds)存储当前的配置,以便动态新增发布/订阅实例。为了提高整体性能,我们在内存里保留了当前的拓扑结构,尽量减少数据库访问的次数。这样的话,实际的消息路由会非常迅速。这个解决方案需要一种机制,能在拓扑结构发生变化的时候去通知所有的服务器(因为任何服务器都能处理负载均衡器)。Amazon SNS能轻而易举地做到这一点。最后,我们用Amazon SQS将通知分发给消费者。需要注意的是,一个消费者可以监听多个队列。 ![](https://docs.gechiui.com/gc-content/uploads/sites/kancloud/2015-08-01_55bc61f0be67b.jpeg) 图4:整体架构建议 ## 发布/订阅服务器 这个实现的核心是一个自定义的发布/订阅服务器。服务器实现包括三个主要的层——持久化、域和服务。 ### 持久化 服务器持久化层采用[JPA 2.0](http://jcp.org/en/jsr/detail?id=317)实现,定义了三个主要的实体——主题、订阅和语义过滤器。 主题实体(清单1)描述了特定主题要存储的相关信息,包括主题ID(数据库的内部ID)、主题名称(标识主题的字符串)、一个布尔变量(定义该主题是否是个根主题)、到父主题和孩子主题的引用(以便对主题层次结构进行遍历),以及与给定主题关联的订阅列表。 ~~~ @Entity @NamedQueries({     @NamedQuery(name="Topic.RootTopics",                     query="SELECT t FROM Topic t where t.root='true'"),     @NamedQuery(name="Topic.AllTopics",                        query="SELECT t FROM Topic t") }) @Table(name = "Topic") public class Topic {  @Id @GeneratedValue(strategy=GenerationType.IDENTITY)  private long id;    // 自动生成的ID  @Column(name = "name",nullable = false, length = 32)  private String name;                     // 主题名称     @Column(name = "root",nullable = false)  private Boolean root = false;          // 根主题标识      @ManyToOne(fetch=FetchType.LAZY)  @JoinColumn(name="TOPIC_ID")  private Topic parent;  @OneToMany(mappedBy="parent",cascade=CascadeType.ALL,orphanRemoval=true)  private List<Topic> children;    @OneToMany(mappedBy="topic",cascade=CascadeType.ALL,orphanRemoval=true)  private List<Subscription> subscriptions; ~~~ 清单1:主题实体 我们定义了两个命名的查询,用来访问主题:RootTopics获取从根开始的主题结构,AllTopics获取所有现有的主题。 这个实体提供了一个完整的主题定义,也可以支持多个主题树(而不是实现示例的一部分)。 订阅实体(清单2)描述了订阅相关的信息,包括订阅ID(数据库的内部ID)、队列名称(SQS队列的ARN,ARN即Amazon Resource Name)、对订阅关联主题的引用,还有一个语义过滤器列表。只有所有的过滤器都接受消息(见下文),通知才会分发给给定的队列(客户端)。如果通知不包含语义过滤器,那来自于关联主题的所有消息都会直接传递给队列。 ~~~ @Entity @NamedQueries({   @NamedQuery(name="Subscription.AllSubscriptions",                       query="SELECT s FROM Subscription s") }) @Table(name = "Subscription") public class Subscription {     @Id @GeneratedValue(strategy=GenerationType.IDENTITY)     private long id;    // 自动生成的ID     @Column(name = "queue",nullable = false, length = 128)     private String queue;       @ManyToOne(fetch=FetchType.LAZY)     @JoinColumn(name="TOPIC_ID")     private Topic topic;          @OneToMany(mappedBy="subscription",                    cascade=CascadeType.ALL,orphanRemoval=true)     private List<SemanticFilter> filters;      …………………………………………………………… ~~~ 清单2:订阅实体 我们还定义了一个命名的查询,获得所有存在的订阅。 最后,语义过滤器实体(清单3)描述了特定语义过滤器的信息,包括语义过滤器ID(数据库的内部ID)、该语义过滤器测试的属性名称、使用的正则表达式,以及对语义过滤器关联订阅的引用。 ~~~ @Entity @NamedQueries({   @NamedQuery(name="SemanticFilter.AllSemanticFilters",                       query="SELECT sf FROM SemanticFilter sf") }) @Table(name = "Filter") public class SemanticFilter {     @Id @GeneratedValue(strategy=GenerationType.IDENTITY)     private long id;    // 自动生成的ID          @Column(name = "attribute",nullable = false, length = 32)     private String attribute;                   // 属性名称     @Column(name = "filter",nullable = false, length = 128)     private String filter;                    // 正则表达式过滤器     @ManyToOne(fetch=FetchType.LAZY)     @JoinColumn(name="SUBSCRIPTION_ID")     private Subscription subscription;     …………………………………………………………… ~~~ 清单3:语义过滤器实体 我们一样定义一个命名的查询,用来获取所有现有的语义过滤器。 除了实体,持久化层还包含一个持久化管理类,负责: 管理数据库访问和事务 从数据库读取、写入对象 对域对象(见下文)和持久化实体进行相互转换 发送拓扑结构变化的通知 ### 域模型 域模型对象的主要职责是支持服务操作,包括数据的订阅和发布,并把通知真正发布到订阅的队列上。在这个简单的实现里,域模型和持久化模型是合在一起的,但为了阐述得更清楚,我们分开介绍。这两层的数据模型是一样的,但域对象会多一些明确支持发布/订阅实现的方法。 过滤器处理的实现(清单4)利用了Java String里对[正则表达式](http://en.wikipedia.org/wiki/Regex)处理的[内置支持](http://www.vogella.com/articles/JavaRegularExpressions/article.html)。 ~~~  public boolean accept(String value){          if(value == null)                return false;          return value.matches(_pattern);  } ~~~ 清单4:过滤器处理方法 发布实现(清单5)是订阅类的一个方法。请注意,这个方法对语义过滤器进行了或操作。如果给定的客户端能有多个订阅,或者对订阅实现进行扩展、让它支持Boolean函数,那就可以突破这个限制了。 ~~~ public void publish(Map<String, String> attributes, String message){        if((_filters != null) && (_filters.size() > 0)){         for(DomainSemanticFilter f : _filters){             String av = attributes.get(f.getField());             if(av == null)                 return;             if(!f.accept(av))                 return;         }     }     SQSPublisher.getPublisher().sendMessage(_queue, message); } ~~~ 清单5:发布实现 这个实现利用了基于现有AWS Java API的SQSPublisher类(清单6)。 ~~~ import java.io.IOException; import com.amazonaws.auth.AWSCredentials; import com.amazonaws.auth.PropertiesCredentials; import com.amazonaws.services.sqs.AmazonSQSClient; import com.amazonaws.services.sqs.model.CreateQueueRequest; import com.amazonaws.services.sqs.model.DeleteQueueRequest; import com.amazonaws.services.sqs.model.SendMessageRequest; public class SQSPublisher {    private static SQSPublisher _publisher;         private AmazonSQSClient _sqs;               private SQSPublisher()throws IOException {             AWSCredentials credentials = new PropertiesCredentials(                   this.getClass().getClassLoader(). getResourceAsStream("AwsCredentials.properties"));             _sqs = new AmazonSQSClient(credentials);    }    public String createQueue(String name){            CreateQueueRequest request = new CreateQueueRequest(name);             return _sqs.createQueue(request).getQueueUrl();    }    public void sendMessage(String queueURL, String message){            SendMessageRequest request = new SendMessageRequest(queueURL, message);             _sqs.sendMessage(request);    }      public void deleteQueue(String queueURL){            DeleteQueueRequest request = new DeleteQueueRequest(queueURL);             _sqs.deleteQueue(request);    }    public static synchronized SQSPublisher getPublisher(){           if(_publisher == null)                   try {                          _publisher = new SQSPublisher();                   }catch (IOException e) {                         e.printStackTrace();                   }            return _publisher;    } } ~~~ 清单6:SQS发布者 订阅者可以利用这个类的其他方法创建/销毁SQS队列。 除了SQS队列,我们的实现还利用SNS进行数据库变化的同步。与SNS的交互由SNSPubSub类实现(清单7),这个实现也利用了AWS SNS Java API。 ~~~ import java.io.IOException; import com.amazonaws.auth.AWSCredentials; import com.amazonaws.auth.PropertiesCredentials; import com.amazonaws.services.sns.AmazonSNSClient; import com.amazonaws.services.sns.model.PublishRequest; import com.amazonaws.services.sns.model.SubscribeRequest; import com.amazonaws.services.sns.model.SubscribeResult; import com.amazonaws.services.sns.model.UnsubscribeRequest; public class SNSPubSub {     private static SNSPubSub _topicPublisher;     private static String _topicARN;     private static String _endpoint;            private AmazonSNSClient _sns;     private String _protocol = "http";     private String _subscriptionARN;            private SNSPubSub()throws IOException {             AWSCredentials credentials = new PropertiesCredentials(                   this.getClass().getClassLoader(). getResourceAsStream("AwsCredentials.properties"));             _sns = new AmazonSNSClient(credentials);     }     public void publish(String message){             PublishRequest request = new PublishRequest(_topicARN, message);             _sns.publish(request);     }          public void subscribe(){             SubscribeRequest request = new SubscribeRequest (_topicARN, _protocol, _endpoint);             _sns.subscribe(request);     }            public void confirmSubscription(String token){             ConfirmSubscriptionRequest request = new  ConfirmSubscriptionRequest(_topicARN, token);             ConfirmSubscriptionResult result = _sns .confirmSubscription(request);             _subscriptionARN = result.getSubscriptionArn();     }          public void unSubscribe(){             if(_subscribed){                    UnsubscribeRequest request = new UnsubscribeRequest(_subscriptionARN);                    _sns .unsubscribe(request);             }     }            public static void configureSNS(String topicARN, String endpoint){              _topicARN = topicARN;             _endpoint = endpoint;     }              public static synchronized SNSPubSub getSNS(){              if(_topicPublisher == null){                     try{                           _topicPublisher = new SNSPubSub();                     }                     catch(Exception e){                           e.printStackTrace();                     }              }              return _topicPublisher;     } } ~~~ 清单7:SNS Pub/Sub 使用SNS 使用SNS的时候要谨记:订阅主题并不意味着你已经准备好监听主题。SNS订阅的过程包含两个步骤。向SNS发送订阅请求时,SNS返回的响应表明确认订阅的必要性。这正是清单8既有subscribe方法又有confirmSubscription方法的原因。 ~~~ <xsd:complextype name="NotificationType">   <xsd:sequence>     <xsd:element name="Type" type="xsd:string" />     <xsd:element name="MessageId" type="xsd:string" />     <xsd:element name="Token" type="xsd:string" minoccurs="0" />     <xsd:element name="TopicArn" type="xsd:string" />     <xsd:element name="Message" type="xsd:string" />     <xsd:element name="SubscribeURL" type="xsd:string" minoccurs="0" />     <xsd:element name="Timestamp" type="xsd:string" />     <xsd:element name="SignatureVersion" type="xsd:string" />     <xsd:element name="Signature" type="xsd:string" />     <xsd:element name="SigningCertURL" type="xsd:string" />     <xsd:element name="UnsubscribeURL" type="xsd:string" minoccurs="0" />   </xsd:sequence> </xsd:complextype> ~~~ 上面的Schema描述了两种消息类型——确认请求和实际的通知。两种类型通过Type元素进行区分。如果元素值是“SubscriptionConfirmation”,那它就是订阅确认的请求,如果是“Notification”,就表明是个真正的通知。 主题类实现了两个方法(清单8),以便支持发布。 ~~~ public void publish(Map<String, String> attributes, String message){          if(_subscriptions == null)         return;     for(DomainSubscription ds : _subscriptions)         ds.publish(attributes, message); } public void processPublications(List<DomainTopic> tList, StringTokenizer st) throws PublicationException{          tList.add(this);     if(!st.hasMoreTokens())         return;     String topic = st.nextToken();     for(DomainTopic dt : _children){         if(topic.equalsIgnoreCase(dt.getName())){             dt.processPublications(tList, st);             return;         }     }     throw new PublicationException("Subtopic " + topic + " is not found in topic " + _name); } ~~~ 清单8:主题对发布的支持 processPublications方法创建了一个主题列表,这些主题与给定的消息相关联。这个方法有一个标记过的主题树字符串,如果标记和主题名称相对应,就会把当前的主题添加到列表中。主题的publish方法维护一个消息属性的映射,对主题相关的每个订阅来说,publish方法还会尝试着去发布一条消息。 上面的方法都由Domain管理器类的publish方法调用(清单9)。这个方法首先标记主题字符串,然后用processPublications方法创建一个订阅者感兴趣的主题列表。列表一旦被创建好,就会构建一个消息属性的映射(我们假设是一个XML消息),并把这个映射发布给列表里的所有主题。 ~~~    public void publish (String topic, String message){         StringTokenizer st = new StringTokenizer(topic, ".");         List<DomainTopic> topics = new LinkedList<Domaintopic>();         DomainTopic root = PersistenceManager.getPersistenceManager().getRoot();         try {                    if(!st.hasMoreTokens())                      return;                 String t = st.nextToken();                    if(!t.equalsIgnoreCase(root.getName()))                      throw new PublicationException("Unrecognized subtopic name " + topic);                    root.processPublications(topics, st);            }catch (PublicationException e) {                    e.printStackTrace();                 return;         }            MessageType msg = null;            try {                    JAXBElement<MessageType> msgEl = (JAXBElement<MessageType>)                      _unmarshaller.unmarshal(new ByteArrayInputStream(message.getBytes()));                   msg = msgEl.getValue();            } catch (JAXBException e) {                    e.printStackTrace();                 return;         }            Map<String, String> attributes = new HashMap<String, String>();         MessageEnvelopeType envelope = msg.getEnvelope();         if(envelope != null){                 for(MessageAttributeType attribute : envelope.getAttribute()){                      attributes.put(attribute.getName(), attribute.getValue());                 }         }         for(DomainTopic t : topics)                 t.publish(attributes, message); } ~~~ 清单9:发布方法实现 ### 服务模型 我们用一组REST服务对发布/订阅功能进行访问(清单10)。 ~~~ @Path("/") public class PubSubServiceImplementation {     // 功能方法     @POST     @Path("publish")     @Consumes("application/text")     public void publish (@QueryParam("topic")String topic, String message) throws PublicationException{             DomainManager.getDomainManager().publish(topic, message);     }     @GET     @Path("publish")     public void publishGet (@QueryParam("topic")String topic, @QueryParam("message")String message)  throws publicationException{             DomainManager.getDomainManager().publish(topic, message);     }     @POST     @Path("synch")     @Consumes("text/plain")     public void getSynchNotification (Object message){             PersistenceManager.setUpdated();     }     // 配置方法     @GET     @Path("root")     @Produces("application/json")     public TopicType getRoot()throws PublicationException {             return DomainManager.getDomainManager().getRoot();     }     @GET     @Path("filters")     @Produces("application/json")     public FiltersType getFilters() throws PublicationException {             return DomainManager.getDomainManager().getFilters();     }     @POST     @Path("filter")     @Consumes("application/json")     public long addFilter(FilterType filter) throws PublicationException {             return DomainManager.getDomainManager().addFilter(filter);     }     @DELETE     @Path("filter/{id}")     public void deleteFilter(@PathParam("id")long id) throws PublicationException {             DomainManager.getDomainManager().removeFilter(id);     }     @GET     @Path("subscriptions")     @Produces("application/json")     public SubscriptionsType getSubscriptions() throws PublicationException {             return DomainManager.getDomainManager().getSubscriptions();     }     @POST     @Path("subscription")     @Consumes("application/json")     public long addSubscription(SubscriptionType s) throws PublicationException {             return DomainManager.getDomainManager().addSubscription(s, null);     }     @DELETE     @Path("subscription/{id}")     public void deleteSubscription(@PathParam("id")long id) throws PublicationException {             DomainManager.getDomainManager().removeSubscription(id);     }     @POST     @Path("subscriptionFilters/{sid}")     @Consumes("application/json")     public long assignFilersToSubscription(@PathParam("sid")long sid, IDsType ids)throws PublicationException{             return DomainManager.getDomainManager().assignFilersToSubscription(sid, ids);     }         @POST     @Path("topic")     @Consumes("application/json")     public long addTopic(TopicType t) throws PublicationException {             return DomainManager.getDomainManager().addTopic(t, null);     }     @DELETE     @Path("topic/{id}")     public void deleteTopic(@PathParam("id")long id) throws PublicationException {             DomainManager.getDomainManager().removeTopic(id);     }     @POST     @Path("topicsubscription/{tid}")     @Consumes("application/json")     public void assignTopicHierarchy(@PathParam("tid")long tid, IDsType ids) throws PublicationException{             DomainManager.getDomainManager().assignTopicHierarchy(tid, ids);     }     @POST     @Path("topicsubscription/{tid}")     @Consumes("application/json")     public long assignTopicSubscriptions(@PathParam("tid")long tid, IDsType ids)throws PublicationException{             return DomainManager.getDomainManager().assignTopicSubscriptions(tid, ids);     } ~~~ 清单10:发布/订阅服务 这些服务的使用者有消息发布者(publish方法)、服务订阅者(创建/删除语义过滤器,订阅,还有订阅和主题订阅相关的过滤器)、内部的发布/订阅实现(获取同步的服务)和管理应用。 ## 结论 这个实现虽然简单,但创建了一个非常强大、可扩展的发布/订阅实现,同时利用了很多现有的AWS功能和少量的Java定制代码。另外它还充分利用了现有AWS部署功能对负载均衡和容错的支持。 ## 作者简介 **Boris Lublinsky博士**是Nokia的主要架构师,参与大数据、SOA、BPM和中间件实现的相关工作。Boris去Nokia前是Herzum软件的主要架构师,负责为客户设计大型、可伸缩的SOA系统;在此之前,他是CNA保险的企业架构师,参与CNA集成和SOA策略的设计及实现,构建应用框架,实现面向服务的架构。Boris在企业技术架构和软件工程方面有二十五年多的经验。他是OASIS SOA RM委员会的活跃成员,和他人一起编著了《Applied SOA: Service-Oriented Architecture and Design Strategies》一书,另外他还写了很多关于架构、编程、大数据、SOA和BPM的文章。 查看英文原文:[基于AWS技术实现发布/订阅服务](http://www.infoq.com/articles/AmazonPubSub) 查看原文:[基于AWS技术实现发布/订阅服务](http://www.infoq.com/cn/articles/AmazonPubSub)
';